Puntero (informática)
En ciencias de la computación, un puntero es un objeto del lenguaje de programación, cuyo valor se refiere a (o "apunta a") otro valor almacenado en otra parte de la memoria del ordenador utilizando su dirección. Un puntero se refiere a una ubicación en memoria, y a la obtención del valor almacenado en esa ubicación se la conoce como desreferenciación del puntero. A modo de analogía, un número de página en el índice de un libro podría considerarse un puntero a la página correspondiente; desreferenciar un puntero sería como ir a la página con el número de página especificada en el índice. Los punteros a datos mejoran significativamente el rendimiento de las operaciones repetitivas tales como cadenas de desplazamiento, tablas de búsqueda, tablas de control y estructuras árbol. En particular, muchas veces es mucho más barato en tiempo y espacio copiar y des referenciar punteros que copiar y acceder a los datos a los cuales apunta el puntero. Los punteros también se utilizan para mantener las direcciones de los puntos de entrada para las subrutinas para llamadas en programación por procedimientos y enlaces para vincular a las bibliotecas de enlace dinámico (DLL) en tiempo de ejecución. En la programación orientada a objetos, los punteros a funciones se utilizan para métodos de unión, muchas veces utilizando lo que se llama tablas de métodos virtuales. Un puntero es una implementación más concreta y simple del tipo de datos de referencia más abstracto. Varios lenguajes soportan algún tipo de puntero, aunque algunos tengan más restricciones en su uso que otros. Mientras que se utilice un "puntero" para referirse a referencias en general, se aplica más propiamente a las estructuras de datos cuya interfaz permita explícitamente que el puntero sea manipulado (aritméticamente vía aritmética de punteros) como una dirección de memoria, en oposición a una cookie u opción dónde esto no sea posible.[cita requerida] Debido a que los punteros permiten tanto proteger como permitir el acceso a direcciones de memoria, hay riesgos asociados con su uso, sobre todo en este último caso. Generalmente, los punteros primitivos son almacenados en un formato similar a un entero; no obstante, intentar eliminar la referencia o "mirar arriba" hacia un puntero cuyo valor no fue nunca una dirección de memoria válida conllevaría a provocar que un programa se bloquee. Para aliviar este potencial problema, como una cuestión de seguridad de tipos, los punteros son considerados un tipo separado parametrizado por un tipo de datos que apuntan a, incluso si la representación subyacente es un número entero. También se pueden tomar otras medidas (como la validación y comprobación de los límites, para verificar el contenido de la variable de puntero contenga un valor que es a la vez una dirección de memoria válida y dentro del rango numérico que el procesador sea capaz de abordar). HistoriaSe le atribuye a Harold Lawson la invención del puntero en 1964.[2] En 2000, Lawson fue presentado el Premio Pionero de Informática por la IEEE "[por la invención de la variable puntero y la introducción de este concepto en PL /I, proporcionando así, por primera vez, la capacidad de tratar con flexibilidad las listas enlazadas en un lenguaje de alto nivel de propósito general".[3] Según el Diccionario inglés de Oxford, la palabra puntero apareció impresa por primera vez como un puntero de pila en un memorando técnico de la System Development Corporation (Corporación de Desarrollo de Sistemas). Descripción formalEn ciencias de la computación, un puntero es un tipo de referencia. Un dato primitivo (o simplemente primitivo) es cualquier dato que puede ser leído o escrito en la memoria del ordenador usando un acceso de memoria (por ejemplo, tanto un byte como una palabra son primitivas).
Un puntero de memoria (o simplemente puntero) es un valor primitivo del cual está destinado a ser utilizado como una dirección de memoria; se dice que un puntero apunta a una dirección de memoria. También se dice que un puntero apunta a un dato [en memoria] cuando el valor del puntero es la dirección de memoria de referencia. Más en general, un puntero es un tipo de referencia, y se dice que un puntero referencia a un dato almacenado en algún lugar de la memoria; para obtener ese dato se desreferencia el puntero. La característica que separa punteros de otros tipos de referencia es que el valor de un puntero está destinado a ser interpretado como una dirección de memoria, que es un concepto bastante de bajo nivel. Las referencias sirven como un nivel de indirección: El valor de un puntero determina que la dirección de memoria (es decir, cual dato) está siendo utilizado en un cálculo. Debido a que la indirección es un aspecto fundamental de los algoritmos, generalmente los punteros son expresados como un tipo de datos fundamental en lenguajes de programación; en forma de lenguajes de programación estáticos (o fuertemente) tipados, el tipo de un puntero determina el tipo de dato al que apunta el puntero. Usos en estructuras de datosCuando se configuren estructuras de datos como listas, colas y árboles, es necesario contar con indicadores para ayudar a controlar cómo se implementa y controla la estructura. Ejemplos típicos de punteros son los de inicio, los punteros finales y los punteros de pila. Estos indicadores pueden ser o bien absolutos (dirección física real o una dirección virtual en la memoria virtual) o relativos (un desplazamiento desde una dirección inicial absoluta ("base") que suele utilizar menos bits que una dirección completa, pero por lo general requieren una operación aritmética adicional para resolverse). Las direcciones relativas son una forma de segmentación de memoria manual, y comparten muchas de sus ventajas y desventajas. Una compensación de dos bytes, que contiene un entero sin signo de 16 bits, se puede utilizar para proporcionar direccionamiento relativo de hasta 64 kilobytes de una estructura de datos. Esto se puede extender fácilmente a 128K, 256K o 512K si la dirección apuntada se ve obligada a alinearse - a mitad de palabras, palabra o doble palabra (pero, lo que requiere una operación de "desviación a la izquierda" a nivel de bits para 1, 2 o 3 bits-con el fin de ajustar el desplazamiento por un factor de 2, 4 u 8, antes de su adición a la dirección de base). Sin embargo, por lo general esos planos tienen un montón de problemas, y por conveniencia para el programador son preferibles las direcciones absolutas del programador (y subyacente a esa, un espacio de dirección plano). Un desplazamiento de un byte, tal como el valor ASCII hexadecimal de un carácter (por ejemplo, X'29') se puede utilizar para apuntar a un valor alternativo entero (o índice) en una matriz (por ejemplo, X'01'). De esta manera, los caracteres pueden ser traducidos de manera muy eficiente partiendo de datos brutos, a un índice secuencial utilizable y luego a una dirección absoluta sin utilizar una tabla de búsqueda. Uso en tablas de controlPor lo general, las tablas de control, que se utilizan para controlar el flujo del programa hacen un amplio uso de punteros. Los punteros, normalmente integrados en una entrada de la tabla, pueden, por ejemplo, ser usados para sostener los puntos de entrada a subrutinas a ser ejecutados, basado en ciertas condiciones definidas en la misma entrada de la tabla. Sin embargo, los indicadores pueden ser simples índices de otros cuadros distintos, pero relacionados, que comprenden un conjunto de las direcciones reales o direcciones propias (dependiendo de las construcciones disponibles del lenguaje de programación). También pueden utilizarse para señalar (retrocediendo) a entradas de la tabla anterior (como en el procesamiento de bucle) o avanzar para pasar algunas entradas de la tabla (como en un switch o salida "prematura" de un bucle). A este último efecto, el "puntero" simplemente puede ser el número de entrada de la tabla en sí y puede pasar a ser una dirección actual usando aritmética simple. Orígenes en la arquitectura de ordenadorLos punteros son una abstracción muy delgada en la parte superior de las capacidades de direccionamiento ofrecidas por la mayoría de las arquitecturas modernas. En el esquema más simple, una dirección, o un índice numérico, se asigna a cada unidad de memoria en el sistema, donde la unidad es típicamente un byte o una palabra - dependiendo de si la arquitectura es direccionable por byte o direccionable por palabra - transformando eficazmente toda la memoria en una matriz muy grande. Entonces, si tenemos una dirección, el sistema provee una operación para recuperar el valor almacenado en la unidad de memoria en esa dirección (por lo general la utilización de registros de propósito general de la máquina). En el caso usual, un puntero es lo suficientemente grande como para contener más direcciones que no sean unidades de memoria en el sistema. Esto introduce la posibilidad de que un programa puede intentar acceder a una dirección que corresponde a ninguna unidad de memoria, ya sea porque no hay suficiente memoria instalada (es decir, más allá del rango de memoria disponible) o porque la arquitectura no soporta dichas direcciones. En el primer caso, en ciertas plataformas como la arquitectura x86 de Intel, se llama un fallo de segmentación (violación de segmento). El segundo caso es posible en la actual aplicación de AMD64, donde los punteros son de 64 bits de largo y direcciones solo se extienden a 48 bits. Allí, punteros deben ajustarse a ciertas normas canónicas (direcciones), así que si un puntero no canónica se eliminan las referencias, el procesador plantea un error de protección general. Por otra parte, algunos sistemas tienen más unidades de memoria que no son direcciones. En este caso, se emplea un esquema más complejo, tal como la segmentación de memoria o de paginación a utilizar diferentes partes de la memoria en diferentes momentos. Las últimas encarnaciones de la arquitectura x86 soportan hasta 36 bits de direcciones de memoria física, que fueron asignadas al espacio de direcciones lineal de 32 bits usando un mecanismo PAE de paginación. Así, solo el 1/16 de la posible memoria total puede ser accedida a la vez. Otro ejemplo de la misma familia de ordenadores estaba el modo protegido de 16 bits del procesador 80286, que, sin embargo, soportaba solamente 16 MiB de memoria física, pudiendo acceso a un máximo de 1 GiB de memoria virtual, pero la combinación de dirección de 16 bits y el segmento de registros hizo acceder a más de 64 KiB en una estructura de datos engorroso. Algunas restricciones de la aritmética del puntero ANSI pudieron haberse debido a los modelos de memoria segmentadas de esta familia de procesadores. [cita requerida] Con el fin de proporcionar una interfaz consistente, algunas arquitecturas proporcionan E/S mapeada en memoria, lo que permite a algunas direcciones que se refieren a las unidades de memoria, mientras que otros se refieren a los registros de dispositivos de otros dispositivos en el ordenador. Hay conceptos análogos tales como desplazamientos de archivo, los índices de matriz, y las referencias a objetos remotos que sirven algunos de los mismos propósitos que las direcciones de otros tipos de objetos. UsosLos punteros son compatibles directamente sin restricciones en lenguajes como PL/1, C, C++, Pascal, y la mayoría de los lenguajes ensambladores. Se utilizan principalmente para la construcción de referencias, que a su vez son fundamentales para la construcción de casi todas las estructuras de datos, así como para pasar datos entre las diversas partes de un programa. En los lenguajes de programación funcionales que dependen en gran medida de las listas, los punteros y referencias son gestionados de manera abstracta por el lenguaje utilizando construcciones internas como const. Cuando se trata de matrices, la crítica operación de búsqueda suele implicar un cálculo de dirección etapa llamada que implica la construcción de un puntero al elemento de datos deseado en la matriz. Si los elementos de datos en la matriz tienen longitudes que son divisibles por potencias de dos, esta aritmética es por lo general un poco más eficiente.[cita requerida] El relleno generalmente es usado como un mecanismo para asegurar que este sea el caso, a pesar del aumento de los requerimientos de memoria. En otras estructuras de datos, tales como las listas enlazadas, los punteros se utilizan como referencias para vincular de forma explícita una sola pieza de la estructura a otra. Los punteros se utilizan para pasar parámetros por referencia. Esto es útil si el programador quiere modificaciones de una función a un parámetro sea visible para llamador de la función de la función. Esto también es útil para devolver varios valores de una función. Los punteros también se puede utilizar para asignar y desasignar en la memoria variables dinámicas y matrices. Ya que muchas veces una variable puede volverse redundante después de que haya cumplido su objetivo, que resulta en una pérdida de la memoria mantenerla, en consecuencia es una buena práctica para desasignarla cuando ya no se necesita, utilizando la referencia de puntero original. El no hacerlo puede resultar en una pérdida de memoria (donde la memoria libre disponible va disminuyendo gradualmente, o en casos severos rápidamente, a causa de una acumulación de numerosos bloques de memoria redundantes). Punteros en CLa sintaxis básica para definir un puntero es:[4] int * ptr;
Esto declara
Esto usualmente se manifiesta de forma más sucinta como ' Debido a que el lenguaje C no especifica una inicialización implícita para los objetos de duración automática de almacenamiento,[5] frecuentemente se debe prestar atención para asegurarse de que la dirección a la que int *ptr = NULL;
Desreferenciar un puntero nulo en C produce un comportamiento indefinido,[7] que podría ser catastrófico. Sin embargo, la mayoría de las implementaciones [cita requerida], simplemente detienen la ejecución del programa en cuestión, usualmente con un fallo de segmentación. Sin embargo, punteros inicializados podría obstaculizar innecesariamente el análisis del programa, ocultando de ese modo los bugs. En cualquier caso, una vez que un puntero ha sido declarado, el siguiente paso lógico es que se apunte a algo: int a = 5;
int *ptr = NULL;
ptr = &a;
Esto asigna el valor de la dirección de *ptr = 8;
Esto significa tomar el contenido de Este ejemplo puede ser más claro si la memoria no es directamente examinada.
Supongamos que int a = 5;
int *ptr = NULL;
(El puntero NULL que se muestra aquí es 0x00000000.)
Mediante la asignación la direcciona de ptr = &a;
produce los siguientes valores de memoria:
Entonces desreferenciando *ptr = 8;
la computadora tendrá el contenido de ptr (que es 0x8130), 'localizado' esa dirección, y asignar 8 a esa ubicación produciendo la siguiente memoria:
Claramente, el acceso a Matrices de CEn C, la indización de matrices se define formalmente en términos de punteros aritméticos, es decir, la especificación del lenguaje requiere que int array[5]; /* Declara 5 enteros contiguos */
int *ptr = array; /* Las matrices pueden ser utilizadas como punteros */
ptr[0] = 1; /* Los punteros se pueden indexar con la sintaxis de matrices */
*(array + 1) = 2; /* Las matrices pueden ser dereferenciadas con sintaxis de puntero */
*(1 + array) = 3; /* La adición del puntero es conmutativa */
2[array] = 4; /* El operador subíndice es conmutativo */
Esto asigna un bloque de cinco enteros y nombres de la matriz por bloques, que actúa como un puntero al bloque. Otro uso común de los punteros es para que apunte a la memoria asignada dinámicamente desde malloc que devuelve un bloque consecutivo de memoria de no menos que el tamaño solicitado que se puede utilizar como una matriz. Aunque la mayoría de los operadores sobre matrices y punteros sean equivalentes, es importante tener en cuenta que el operador Los valores por defecto de una matriz se pueden declarar como: int array[5] = {2,4,3,1,5};
Si se asume que
Aquí están representados cinco enteros: 2, 4, 3, 1 y 5. Estos cinco enteros ocupan 32 bits (4 bytes) cada uno con el byte menos significativo que se almacena primero (esto es una arquitectura de CPU little endian) y se almacenan de forma consecutiva comenzando en la dirección 0x1000. La sintaxis de C con punteros es:
El último ejemplo es cómo acceder a los contenidos del
Por ejemplo Lista vinculada en CA continuación se muestra un ejemplo de definición de una lista enlazada en C. /* la lista enlazada vacía está representada por NULL
* o algún otro valor centinela */
#define EMPTY_LIST NULL
struct link {
void *datos; /* datos de este vínculo */
struct link *proximo; /* siguiente enlace; EMPTY_LIST si no hay ninguno */
};
Nótese que esta definición puntero-recursivo es esencialmente la misma que la definición de referencia-recursiva del lenguaje de programación Haskell: data Link a = Nil
| Cons a (Link a)
Sin embargo, la definición de referencias es de tipo comprobado y no utiliza los valores de señal potencialmente confusos. Por esta razón, en C, las estructuras de datos normalmente se tratan a través de funciones contenedor, que son cuidadosamente verificadas para su corrección. Pasaje por dirección utilizando punterosLos punteros se pueden usar para pasar variables por su dirección, lo que permite cambiar su valor. A modo de ejemplo, se considera el siguiente código en C: #include <stdio.h>
/* se puede cambiar una copia de int n dentro de la función sin afectar el código de llamada */
void passbyvalue(int n) {
n = 12;
}
/* En su lugar, se pasa un puntero a m. No se crea ninguna copia m de sí mismo */
void passbyaddress(int *m) {
*m = 14;
}
int main(void) {
int x = 3;
/* pasar una copia del valor de x como argumento */
passbyvalue(x);
// el valor ha cambiado dentro de la función, pero x sigue siendo 3 de aquí posteriormente
/* pasar la dirección de x como argumento */
passbyaddress(&x);
// en realidad x fue cambiada por la función y ahora aquí es igual a 14
return 0;
}
Asignación dinámica de memoriaLos punteros se utilizan para almacenar y administrar las direcciones de los bloques de memoria asignados dinámicamente. Dichos bloques se utilizan para almacenar objetos o conjuntos de objetos de datos. Los lenguajes más estructurados y orientados a objetos proporcionan un área de memoria, llamada el montón o tienda libre, de la que objetos dinámicamente asignados. El código de ejemplo C siguiente ilustra cómo se asignan dinámicamente objetos de estructura y referencia. La biblioteca C estándar proporciona la función /* Item de inventario de partes */
struct Item {
int id; /* Número de parte */
char * name; /* Nombre de parte */
float cost; /* Costo */
};
/* Asignar e inicializar un nuevo objeto de elemento */
struct Item * make_item(const char *name) {
struct Item * Item;
/* Asignar un bloque de memoria para un nuevo objeto de elemento */
Item = (struct Item *)malloc(sizeof(struct Item));
if (Item == NULL)
return NULL;
/* Inicializa los miembros del nuevo elemento */
memset(Item, 0, sizeof(struct Item));
Item->id = -1;
Item->name = NULL;
Item->cost = 0.0;
/* Guarde una copia del nombre en el nuevo elemento */
Item->name = (char *)malloc(strlen(name) + 1);
if (Item->name == NULL) {
free(Item);
return NULL;
}
strcpy(Item->name, name);
/* Devuelve el objeto de artículos recientemente creados */
return Item;
}
El código siguiente muestra cómo se desasignan dinámicamente objetos de memoria, es decir, retorna al montón o tienda libre. La biblioteca C estándar proporciona la función /* Desasignar un objeto Item */
void destroy_item(struct Item *item) {
/* Check for a null object pointer */
if (item == NULL)
return;
/* Desasignar la cadena de nombre guardado en el Item */
if (item->name != NULL) {
free(item->name);
item->name = NULL;
}
/* Desasignar el propio objeto Item */
free(item);
}
Hardware asignado en memoriaEn algunas arquitecturas de computación, los punteros pueden ser utilizados para manipular directamente de memoria o dispositivos asignados a la memoria. La asignación direcciones a los punteros es una herramienta invaluable en la programación de microcontroladores. A continuación se muestra un simple ejemplo de declaración de un puntero de tipo int y la inicialización a una dirección hexadecimal en este ejemplo el constante int *hardware_address = (int *)0x7FFF;
A mediados de los años 80, usar la BIOS para acceder a las capacidades de video de PC era lento. Las aplicaciones que se encontraban en pantalla intensiva normalmente se utiliza para acceder a la memoria de vídeo CGA directamente mediante colada las constantes hexadecimales 0xb8000 a un puntero a un array de 80 valores int de 16 bits sin signo. Cada valor consistía en un código ASCII en el byte bajo y un color en el byte alto. Por lo tanto, para poner la letra 'A' en la línea 5, columna 2 blanco sobre azul luminoso, uno podría escribir código como el siguiente: #define VID ((unsigned short (*)[80])0xB8000)
void foo() {
VID[4][1] = 0x1F00 | 'A';
}
Punteros con tipo y fundiciónEn muchos lenguajes, los punteros tienen la restricción adicional de que el objeto que apuntan tiene un tipo específico. Por ejemplo, un indicador puede ser declarado para apuntar a un número entero; será el lenguaje el que trate de evitar que el programador apunte a objetos que no fuesen números enteros, tales como números de coma flotante, eliminando algunas errores. Por ejemplo, en C int *money;
char *bags;
bags = money;
porque bags = (char *)money;
que dice emitir el puntero entero de Un proyecto de la norma C estándar de 2005 requiere que echando un puntero derivado de un tipo a uno de otro tipo debía mantener la corrección de alineación para ambos tipos (6.3.2.3 Punteros, par 7):[9] char *external_buffer = "abcdef";
int *internal_data;
internal_data = (int *)external_buffer; // COMPORTAMIENTO INDEFINIDO si "el puntero resultante
// no está correctamente alineado"
En lenguajes que permiten la aritmética de punteros, dicha aritmética en punteros tiene en cuenta el tamaño del tipo. Por ejemplo, la adición de un número entero a un puntero produce otro puntero que apunta a una dirección que es superior en número de veces que el tamaño del tipo. Esto nos permite calcular fácilmente la dirección de elementos de una matriz de un tipo determinado, como se demostró en el ejemplo matrices C descripto arriba. Cuando un puntero de un tipo se convierte en otro tipo de un tamaño diferente, el programador debe esperar que el puntero aritmético se calcule de manera diferente. En C, por ejemplo, si la matriz Aunque por lo general sea imposible determinar en tiempo de compilación que arroja son seguros, algunos lenguajes almacenan el tipo de información en tiempo de ejecución que puede ser utilizado para confirmar que estos peligrosos moldes son válidos en tiempo de ejecución. Otros lenguajes simplemente aceptan una aproximación conservadora de moldes seguros, o ninguno en absoluto. Haciendo más seguros a los punterosComo un puntero permite que un programa intente acceder a un objeto que puede no estar definido, dichos punteros pueden ser el origen de una variedad de errores de programación. Sin embargo, la utilidad de los punteros es tan grande que puede ser difícil realizar tareas de programación sin ellos. En consecuencia, muchos lenguajes han creado construcciones diseñadas para proporcionar algunas de las características útiles de los punteros sin algunas de sus trampas, también denominadas algunas veces peligros de punteros. En este contexto, los punteros que se dirigen directamente a la memoria (como se usa en este artículo) se conocen como punteros crudos o sin procesar, en contraste con punteros inteligentes u otras variantes. Uno de los mayores problemas con los punteros es que al poderse manipular directamente como un número, se pueden hacer que este apunte a direcciones no utilizadas o a datos que se está utilizando para otros fines. Muchos lenguajes, incluyendo lenguajes de programación funcionales y los últimos lenguajes imperativos como Java, reemplazan los punteros con un tipo más opaco de referencia, típicamente referido simplemente como referencia, que solo puede ser usado para referirse a los objetos y no manipula a los números, previniendo este tipo de error. La indexación de una matriz se trata como un caso especial. Un puntero que no tenga ninguna dirección asignada al mismo se denomina puntero salvaje. Cualquier intento de utilizar estos punteros no inicializados puede causar un comportamiento inesperado, ya sea porque el valor inicial no es una dirección válida, o porque su uso puede dañar otras partes del programa. El resultado suele ser un fallo de segmentación, violación de almacenamiento o rama natural (si se utiliza como un puntero de función o de dirección de rama). En sistemas con asignación de memoria explícita, es posible crear un puntero de referencia colgante para des-asignar la dirección de memoria que apunta dentro. Este tipo de puntero es peligroso y sutil, ya una región de memoria des-asignada puede contener los mismos datos como lo hizo antes de que se cancele la asignación, pero puede ser reasignado a continuación y se sobrescriben con código ajeno, desconocido para el código anterior. Los lenguajes con recolector de basura previenen este tipo de error porque des afectación se realiza automáticamente cuando no hay más referencias en el alcance. Algunos lenguajes, como C++, soportan punteros inteligentes, que utilizan una forma simple de conteo de referencias con el fin de ayudar a la asignación de un registro de la memoria dinámica, además de actuar como referencia. En la ausencia de ciclos de referencia, donde un objeto se auto refiere indirectamente mediante una secuencia de punteros inteligentes, éstos eliminan la posibilidad de punteros colgantes y pérdidas de memoria. Las cadenas en Delphi soportan, de forma nativa, recuento de referencias. Puntero nuloUn puntero nulo tiene un valor reservado para indicar que el puntero no se refiere a un objeto válido. Los punteros nulos se utilizan habitualmente para representar las condiciones tales como el final de una lista de longitud desconocida o el fracaso para llevar a cabo algún tipo de acción, lo que el uso de punteros nulos se puede comparar con los tipos que aceptan valores NULL y el valor de nada en un tipo de opción. Frecuentemente, los punteros nulos se consideran similares a los valores nulos en las bases de datos relacionales, pero tienen una semántica algo diferente. En la mayoría de los lenguajes de programación, un puntero nulo significa "ningún valor", mientras que en una base de datos relacional, un valor nulo significa "valor desconocido". Esto conduce a importantes diferencias en la práctica: en la mayoría de los lenguajes de programación consideran iguales dos punteros nulos se, pero no lo son dos valores nulos en las bases de datos relacionales (no se sabe si son iguales, ya que representan valores desconocidos). En algunos entornos de lenguaje de programación (al menos, por ejemplo, una implementación de Lisp propietaria[cita requerida]), el valor utilizado como puntero nulo (llamado En C, dos punteros nulos de cualquier tipo están garantidos para comparar iguales tipo de datos[10] El macro Típicamente, desreferenciar el puntero NULL significa intentar leer o escribir en la memoria que no se asigna, esto desencadena un fallo de segmentación o violación de acceso. Esto puede representar en sí mismo, para el desarrollador, un fallo en el programa, o se transforma en una excepción que puede capturarse. Sin embargo, hay ciertas circunstancias en las que esto no es el caso. Por ejemplo, en modo en x86 real, la dirección 0000:0000 es legible y por lo general escribible, de ahí que la eliminación de referencias de puntero nulo sea una acción perfectamente válida pero, en general, no deseada que puede conducir a un comportamiento indefinido, pero no causa un crash en la aplicación. Además, tener en cuenta que hay ocasiones en que la desreferenciación NULL es intencional y bien definida, como por ejemplo el código del BIOS, escrito en C, para dispositivos x86 de 16 bits en modo real, puede escribir la IDT en la dirección física 0 de la máquina, desreferenciando al puntero a NULL para la escritura. También es posible que el compilador optimice desde lejos el puntero de dereferencia `NULL`, evitando un fallo de segmentación pero sin causar otro tipo de comportamiento no deseado. En C++, ya que el macro No se debe confundir un puntero nulo con un puntero no inicializado: Un puntero nulo está garantizado para comparar desigual a cualquier puntero que apunta a un objeto válido. Sin embargo, en función del idioma y la aplicación, un puntero no inicializado tiene, o bien un valor indeterminado (al azar o sin sentido), o un valor específico que no tiene porqué ser necesariamente una especie de puntero nulo constante. En 2009, C. A. R. Hoare declaró[13][14] que en 1965 inventó la referencia nula como parte del lenguaje Algol W, aunque, desde 1959, NIL hubiera existido en Lisp. En esa referencia de 2009 Hoare describe su invención como un "error de millones de dólares":
Debido a que un puntero nulo no apunta a un objeto significativo, por lo general, (pero no siempre) intentar eliminar la referencia a un puntero nulo provoca un error en tiempo de ejecución o la inmediata caída del programa.
En lenguajes con una arquitectura de etiquetado, posiblemente, un puntero nulo pueda ser reemplazado con una unión marcada que impone la manipulación explícita del caso excepcional, de hecho, un puntero nulo, posiblemente, pueda ser visto como un puntero etiquetado con una etiqueta computarizada. Puntero baseUn puntero base es un puntero cuyo valor es un desplazamiento desde el valor de otro puntero. Esto puede ser usado para almacenar y cargar los bloques de datos, asignando la dirección de comienzo del bloque al puntero base.[17] Indirección múltipleEn algunos lenguajes, un puntero puede hacer referencia a otro puntero, lo que requiere múltiples operaciones de des referenciación para llegar al valor original. Mientras que cada nivel de indirección puede añadir un costo de rendimiento, es a veces necesario para proporcionar un comportamiento correcto para estructuras de datos complejas. Por ejemplo, en C es típico definir una lista enlazada, en términos de un elemento que contiene un puntero al siguiente elemento de la lista: struct element
{
struct element * next;
int value;
};
struct element * head = NULL;
Esta aplicación utiliza un puntero al primer elemento de la lista como un sustituto para la lista completa. Si se añade un nuevo valor al principio de la lista, debe cambiarse la cabecera para que apunte al nuevo elemento. Dado que argumentos C siempre se pasan por valor, utilizando direccionamiento indirecto doble se permite la inserción de implementarse correctamente, y tiene el efecto secundario deseable de eliminar el código de casos especiales para hacer frente a las inserciones en la parte delantera de la lista: // Dada una lista ordenada en la * cabecera, insertar el elemento elemento en la primera
// lugar donde todos los elementos anteriores tienen menor o igual valor.
void insert(struct element **head, struct element *item)
{
struct element ** p; // p apunta a un puntero de un elemento
for (p = head; *p != NULL; p = &(*p)->next)
{
if (item->value <= (*p)->value)
break;
}
item->next = *p;
*p = item;
}
// El llamador hace esto:
insert(&head, item);
En este caso, si el valor de Un ejemplo básico es en el argumento argv de la función principal en C (y C ++), que se da en el prototipo como Puntero a funciónEn algunos lenguajes, un puntero puede hacer referencia a código ejecutable, es decir, puede apuntar a una función, método o procedimiento. Un puntero a función almacenará la dirección de una función que sea invoca. Si bien este mecanismo se puede utilizar para llamar a funciones de forma dinámica, muchas veces es una técnica favorita de virus y otros autores de software malicioso. int a, b, x, y;
int sum(int n1, int n2); // Función con dos parámetros enteros que devuelve un valor entero
int (*fp)(int, int); // Puntero de función que puede apuntar a una función como la suma
fp = ∑ // fp ahora apunta a la función suma
x = (*fp)(a, b); // La función suma llama con argumentos a y b
y = sum(a, b); // La función suma llama con argumentos a y b
Puntero salvajeUn puntero salvaje es un puntero que no se ha sido inicializado (es decir, un puntero salvaje no ha tenido ninguna dirección asignada a él) y puede provocar un fallo en el programa o comportarse de manera extraña. En los lenguajes de programación Pascal o C, los punteros que no están específicamente inicializados pueden apuntar a direcciones impredecibles en la memoria. El siguiente código de ejemplo muestra un puntero salvaje: int func(void)
{
char *p1 = malloc(sizeof(char)); /* (valor (indefinido) de algún lugar del montón */
char *p2; /* puntero salvaje (sin inicializar) */
*p1 = 'a'; /* Esto está bien, asumiendo que malloc() no haya devuelto NULL. */
*p2 = 'b'; /* Así se invoca un comportamiento indefinido */
}
Aquí, Simulación utilizando un índice de matrizEs posible simular el comportamiento del puntero usando un índice a un matriz (normalmente unidimensional) Principalmente para lenguajes que no soportan punteros de manera explícita pero realizan soporte de matrices, la matriz se puede considerar y procesar como si fuera el rango de memoria completo (dentro del alcance de la matriz particular) y cualquier índice a ella puede considerarse como equivalente a un registro de propósito general en lenguaje ensamblador (que apunta a los bytes individuales pero cuyo valor real es relativo al comienzo de la matriz, no su dirección absoluta en memoria). Suponiendo que la matriz es, por ejemplo, una estructura de datos de caracteres contiguos de 16 megabytes, los bytes individuales (o una cadena de bytes contiguos dentro de la matriz) puede ser directamente dirigida y manipulada usando el nombre de la matriz con un entero sin signo de 31 bits como el puntero simulado (esto es bastante similar al ejemplo de arreglos de C mostrado anteriormente). La aritmética de punteros puede simularse mediante la adición o sustracción del índice, con una sobrecarga adicional mínima en comparación con la verdadera aritmética de punteros. Incluso es teóricamente posible, utilizando la técnica anterior, juntar con un simulador de juego de instrucciones adecuadas para simular cualquier código de máquina o el intermedio (bytescode) de cualquier procesador/lenguaje en otro lenguaje que no admite punteros en absoluto (por ejemplo Java / JavaScript). Para lograr esto, el código binario se puede cargar inicialmente en los bytes contiguos de la matriz para que el simulador "lea", interprete y se ejecute enteramente dentro de la memoria contenida de la misma matriz. Si es necesario, generalmente se puede activar comprobación de límites por el compilador, a los efectos de evitar por completo los problemas de desbordamiento de búfer (o si no, codificar a mano en el simulador). Punteros en lenguajes de programaciónEn programación es posible crear procedimientos, estructuras, variables, constantes entre otras cosas, cuando es ejecutada cada una de estas estructuras tiene una dirección en memoria, es conveniente conocer este tipo de información cuando se trabaja con lenguajes que soportan los punteros de manera no abstracta. A continuación veremos cómo trabajan los punteros en variables, estructuras y uniones. Los punteros que apunten a estas estructuras de almacenamiento estarán dirigidos a los primeros miembros de cada estructura, unión o matriz. EstructurasLas estructuras de datos reservan segmentos en memoria separados para cada miembro, esto significa que cada miembro tiene su propia dirección en memoria (su propio puntero). Podemos representar gráficamente una estructura de datos llamada "Estructura" de la siguiente manera: 1 1 4 Bytes. +-----+-----+---------+ | A | B | C | Miembros. +-----+-----+---------+ 0x1 0x2 0x3 Dirección. ^ | Puntero base de la estructura completa. Como se puede ver, existen 3 métodos de tipo numérico en memoria llamados "A","B" y "C", los dos primeros métodos (A y B) son de tipo Byte y tienen reservado 1 byte cada uno en distintos segmentos en la memoria, por lo que tienen diferentes direcciones (0x01 y 0x02 en su respectivo orden). La dirección de memoria de la estructura en general es igual a la dirección de su primer miembro, la dirección de su segundo miembro es igual a la dirección de su primer miembro, mas su tamaño en bytes y la dirección del tercer miembro es igual a la dirección del primer miembro, más el tamaño de los dos miembros anteriores y así sucesivamente. UnionesLa principal diferencia entre una unión y una estructura es la memoria utilizada, a diferencia de las estructuras, las uniones solo utilizan la cantidad de memoria de su miembro más grande, y todos los miembros comparten una única dirección en memoria. Por ejemplo: 4 Bytes. +-----------+ | A B C | Miembros. +-----------+ 0x1 Dirección. Los miembros "A" y "C" solo pueden contener valores entre 0 y 255 (Tipo Byte), el miembro "B" puede tener valores entre 0 y 4.294.967.295 (Tipo Entero), si el miembro "A" cambia su valor a 13, también lo hacen los miembros "B" y "C" (A,B y C son igual a 13), si el miembro "B" cambia su valor a 4000, los miembros "A" y "C" se quedan únicamente en 160 ya que tratan de traducir el valor 4000 a byte (A y C son igual a 160, B = 4000), el tamaño total de la unión es de 4 bytes debido a que los miembros comparten la misma memoria (la unión pesa lo mismo que su miembro con mayor reserva de memoria). MatricesLas matrices son casi igual que las estructuras, reservan memoria para cada matriz, la dirección en memoria de cada miembro es consecutiva a la suma de sus anteriores, mas sus tamaños y la dirección de la matriz total es igual a la del primer miembro, la única diferencia entre una matriz y una estructura es que cada matriz tiene el mismo tipo de dato (los miembros de una estructura pueden ser de distintos tipos). Podemos representar a una matriz con rango de 3 (tipo entero) en memoria de la siguiente manera. 4 4 4 Bytes. +-----+-----+-----+ | 0 | 1 | 2 | Identificador. +-----+-----+-----+ 0x1 0x5 0x9 Dirección. Como se puede apreciar, cada miembro tiene una dirección en memoria con 4 bytes de diferencia entre sí. El puntero base de la matriz entera es la dirección de su primer matriz (Matriz@ = Matriz[0]@). Soporte en lenguajes de programaciónAdaAda es un lenguaje fuertemente tipado en el cual todos los punteros son tipados y solamente se permiten conversiones de tipos de seguros. Todos los indicadores están por defecto inicializado en BASICVarias versiones antiguas de BASIC para la plataforma Windows tenían soporte para STRPTR() para devolver la dirección de una cadena, y para VARPTR() para devolver la dirección de una variable. Visual Basic 5 también tenía soporte para OBJPTR() para devolver la dirección de una interfaz de objeto, y para un operador ADDRESSOF para devolver la dirección de una función. Los tipos de todos estos son números enteros, pero sus valores son equivalentes a estos valores por tipos de puntero. Sin embargo, dialectos más recientes de BASIC, como FreeBASIC o BlitzMax, tienen implementaciones de puntero exhaustivas. En FreeBASIC, la aritmética en punteros dim as integer f = 257
dim as any ptr g = @f
dim as integer ptr i = g
assert(*i = 257)
assert( (g + 4) = (@f + 1) )
C y C++En C y C++ los punteros son variables que almacenan direcciones y pueden ser null. Cada puntero tiene un tipo que apunta, pero el programador puede convertir libremente entre tipos de puntero (pero no entre un puntero a función y no la función de tipo de puntero). Un tipo de puntero especial llamado el "vacío puntero" permite que apunta a cualquier tipo de variable (no función), pero es limitada por el hecho de que no se puede eliminar las referencias de forma directa. La dirección en sí a veces puede ser manipulada directamente mediante colada un puntero hacia y desde un tipo entero de tamaño suficiente, aunque los resultados se han definido por la implementación y de hecho pueden causar un comportamiento indefinido; mientras que los estándares anteriores a C no tengan un tipo entero que garantice que sea lo suficientemente grande, C99 especifica el nombre definido C++ es totalmente compatible con los punteros de C y el typecasting de C. También es compatible con una nueva agrupación de operadores de typecasting para ayudar a capturar a algunos casts peligrosos no deseados en tiempo de compilación. Desde C++11, la librería estándar de C++ también proporciona punteros inteligentes ( La aritmética de punteros, es decir, la capacidad de modificar la dirección de destino de un puntero con operaciones aritméticas (así como comparaciones de magnitud), está restringido por el lenguaje estándar para permanecer dentro de los límites de un solo objeto arreglo (o justo después de él), porque de otro modo provocaría un comportamiento indefinido. Sumando o restando de un puntero que desplaza por un múltiplo del tamaño del tipo de datos que apunta. Por ejemplo, la adición de 1 a un puntero a valores enteros de 4 bytes incrementará el puntero por 4. Esto tiene el efecto de incrementar el puntero para señalar en el siguiente elemento en una matriz contigua de números enteros-que muchas veces presenta un resultado previsto. La aritmética de punteros no se puede realizar en punteros La aritmética de punteros le provee al programador una única manera de tratar con diferentes tipos: sumando y restando el número de los elementos requeridos en lugar del actual desplazamiento en bytes. (aunque el puntero sea Aunque poderosa, la aritmética de punteros puede ser una fuente de errores informáticos. Este tiende a confundir a los programadores novatos, forzándolos a diferentes contextos: una expresión puede ser una aritmética ordinaria uno o una aritmética de punteros uno, ya veces es fácil confundir uno con el otro. En respuesta a esto, muchas lenguajes informáticos modernos de alto nivel (por ejemplo Java) no permiten el acceso directo a memoria utilizando direcciones. Además, el dialecto seguro de C, Cyclone, aborda muchos de los problemas con los punteros. Véase lenguaje de programación C de examinar más. El puntero int x = 4;
void* q = &x;
int* p = q; /* void* convierte implícitamente a int*: válido en C, pero no en C++ */
int i = *p;
int j = *(int*)q; /* cuando se desreferencia en línea, no hay conversión implícita */
C++ no permite la conversión implícita de int x = 4;
void* q = &x;
// int* p = q; Esto falla en C++: no hay conversión implícita de void*
int* a = (int*)q; // cast estilo C
int* b = static_cast<int*>(q); // C++ cast
En C++, no hay C#En el lenguaje de programación C#, los punteros son compatibles solo bajo ciertas condiciones: cualquier bloque de código que incluya punteros debe ser marcada con la palabra clave Una excepción a esto es utilizar la estructura de // Obtener 16 bytes de memoria de la memoria no administrada del proceso
IntPtr pointer = System.Runtime.InteropServices.Marshal.AllocHGlobal(16);
// Hacer algo con la memoria asignada
// Liberar la memoria asignada
System.Runtime.InteropServices.Marshal.FreeHGlobal(pointer);
El .NET Framework incluye muchas clases y métodos en el sistema y los espacios de nombres COBOLEl lenguaje de programación COBOL soporta punteros a variables. Los objetos primitivos o datos de grupos (graban) objetos de datos declarados dentro de la El espacio de memoria para cada señaló a objeto de datos se suelen asignar dinámicamente utilizando las sentencias Las versiones extendidas de COBOL también proporcionan variables de puntero declarados con cláusulas Algunas versiones extendidas de COBOL también proporcionan variables de PL/IEl lenguaje PL/I proporciona soporte completo para punteros a todos los tipos de datos (incluyendo punteros a estructuras), recursividad, multitarea, manejo de cadenas, y amplias funciones incorporadas. PL/I era un salto absoluto hacia adelante en comparación con los lenguajes de programación de su tiempo.[cita requerida] DEl lenguaje de programación D es un derivado de C y C++, que es totalmente compatible con los punteros de C y los typecasting de C. EiffelEl lenguaje Eiffel orientado a objetos soporta punteros en forma de referencias, que se escriben y no permiten ningún tipo de aritmética de punteros. El estándar ECMA para Eiffel incluye un mecanismo de "tipo adjunto" que pretende garantizar un void seguro. FortranFortran-90 introdujo la capacidad de puntero inflexible de tipos. Los punteros en Fortran contienen algo más que una simple dirección de memoria. También encapsulan los límites inferior y superior de dimensiones de matriz, pasos (por ejemplo, para soportar a las secciones de matriz arbitrarias), y otros metadatos. Un operador asociación, => se utiliza para asociar un puntero a una variable que tiene un atributo type real_list_t
real :: sample_data(100)
type (real_list_t), pointer :: next => null ()
end type
type (real_list_t), target :: my_real_list
type (real_list_t), pointer :: real_list_temp
real_list_temp => my_real_list
do
read (1,iostat=ioerr) real_list_temp%sample_data
if (ioerr /= 0) exit
allocate (real_list_temp%next)
real_list_temp => real_list_temp%next
end do
Fortran-2003 añade soporte para punteros de procedimiento. También, como parte de la función de Interoperabilidad de C, Fortran-2003 es compatible con las funciones intrínsecas para la conversión de punteros al estilo C a punteros Fortran y traseros. GoGo tiene punteros. Su sintaxis de declaración es equivalente a la de C, pero escrito al revés, terminando con el tipo. A diferencia de C, Go tiene la recolección de basura, y no permite la aritmética de punteros. Al igual que en C++, no existen los tipos de referencia. Algunos tipos incorporados, como los mapas y canales, están encuadradas (es decir, internamente son punteros a estructuras mutables), y se inicializan utilizando la función JavaA diferencia de C, C++ o Pascal, no hay representación explícita de punteros en Java. En cambio, las estructuras de datos más complejas como los objetos y las matrices se implementan utilizando referencias. El lenguaje no ofrece operadores explícitos de manipulación de punteros. Aún es posible para el código intentar eliminar la referencia de una referencia nula (puntero null), sin embargo, lo que resulta en una excepción de tiempo de ejecución que es lanzada. El espacio ocupado por objetos de memoria no referenciados se recupera automáticamente recolectando la basura en tiempo de ejecución.[18] Modula-2Los punteros son fuertemente implementados como en Pascal, al igual que los parámetros OberonAl igual que Modula-2, los punteros están disponibles. Aún hay un menor número de maneras de evadir el sistema de tipos y así Oberon y sus variantes son aún más seguros con respecto a los punteros de Modula-2 o sus variantes. Al igual que con Modula-3, la recolección de basura es una parte de la especificación del lenguaje. PascalA diferencia de muchas lenguajes que cuentan con punteros, el estándar ISO Pascal solo permite punteros para hacer referencia a las variables creadas dinámicamente que son anónimas y no les permiten referenciar estándares estáticos o variables locales.[19] No tiene aritmética de punteros. Los punteros deben también de tener un tipo asociado, y un puntero a un tipo no es compatible con un puntero a otro tipo (por ejemplo, un puntero a un char no es compatible con un puntero a un entero). Esto ayuda a eliminar los problemas de seguridad inherentes tipo con otras implementaciones de puntero, especialmente los utilizados para PL/I o C. También elimina algunos riesgos causados por punteros colgados, pero la capacidad de dejar de lado el espacio de forma dinámica se hace referencia mediante el procedimiento estándar Sin embargo, en algunas implementaciones comerciales y de código abierto de compiladores de Pascal (o derivados)-como Free Pascal,[21] Turbo Pascal o Object Pascal en Embarcadero Delphi—se le permite un puntero hacer referencia a las variables estáticas o locales estándares y se puede lanzar desde un tipo puntero a otro. Por otra parte la aritmética de punteros está restringida: añadiendo o restando de un puntero se mueve por ese número de bytes en cualquier dirección, pero utilizando los procedimientos estándar PauscalEl lenguaje de programación Pauscal presenta un fuerte soporte de punteros, permitiendo apuntar a variables, estructuras, procedimientos, prototipos, uniones e incluso clases y sus métodos. Los punteros se pueden utilizar para almacenar la dirección en memoria de un objeto o para crear una referencia a este. Pauscal utiliza los punteros para convertir tipos de datos sin necesidad de ninguna interfaz de programación de aplicaciones (API) externa, aumentando la velocidad de ejecución de los programas ligeramente y permitiendo que estos sean "nativos" del lenguaje. PerlEl lenguaje de programación Perl soporta punteros, aunque raramente se utilizan, en forma de funciones de empaquetado y desempaquetado. Estos están destinados únicamente a las interacciones simples con bibliotecas OS compiladas. En todos los demás casos, Perl utiliza referencias, que se escriben y no permiten ningún tipo de aritmética de punteros. Estos se utilizan para construir complejas estructuras de datos.[22] Véase también
Referencias
Enlaces externos
|