X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/66a118f6c023835898f113380cfa401199b490a3..b74248615fcdff549e2c6eef4180f64007fcb70c:/source/gc.rst diff --git a/source/gc.rst b/source/gc.rst index c37672f..4f9f91a 100644 --- a/source/gc.rst +++ b/source/gc.rst @@ -17,6 +17,13 @@ Introducción del *heap* [#gcheap]_ una vez que el programa ha dejado de hacer referencia a ella (y por lo tanto, ha dejado de utilizarla). +.. [#gcheap] *Heap* es un área de memoria que se caracteriza por ser + dinámica (a diferencia del área de memoria estática que está disponible + durante toda la ejecución de un programa). Un programa puede reservar + memoria en tiempo de ejecución según sea necesario y liberarla cuando ya + no la necesita. A diferencia del *stack*, la duración de la *reserva* no + está atada a un bloque de código. + A medida que el tiempo pasa, cada vez los programas son más complejos y es más compleja la administración de memoria. Uno de los aspectos más importantes de un recolector de basura es lograr un mayor nivel de @@ -32,6 +39,21 @@ recolector de basura. Por ejemplo, los errores en el manejo de memoria (como *buffer overflows* [#gcbuff]_ o *dangling pointers* [#gcdang]_) son la causa más frecuente de problemas de seguridad [BEZO06]_. +.. [#gcbuff] Un *buffer overflow* (*desbordamiento de memoria* en + castellano) se produce cuando se copia un dato a un área de memoria que + no es lo suficientemente grande para contenerlo. Esto puede producir que + el programa sea abortado por una violación de segmento, o peor, + sobreescribir un área de memoria válida, en cuyo caso los resultados son + impredecibles. + +.. [#gcdang] Un *dangling pointer* (*puntero colgante* en castellano) es un + puntero que apunta a un área de memoria inválida. Ya sea porque el + elemento apuntado no es el mismo tipo o porque la memoria ya ha sido + liberada. Al ser desreferenciado, los resultados son impredecibles, el + programa podría abortarse por una violación de segmento o podrían pasar + peores cosas si el área de memoria fue realocada para almacenar otro + objeto. + La recolección de basura nació junto a Lisp_ a finales de 1950 y en los siguientes años estuvo asociada principalmente a lenguajes funcionales, pero en la actualidad está presente en prácticamente todos los lenguajes de @@ -64,26 +86,6 @@ puntos de falla no controlados por el programador, volviendo mucho más difícil la búsqueda de errores. -.. [#gcheap] *Heap* es un área de memoria que se caracteriza por ser - dinámica (a diferencia del área de memoria estática que está disponible - durante toda la ejecución de un programa). Un programa puede reservar - memoria en tiempo de ejecución según sea necesario y liberarla cuando ya - no la necesita. A diferencia del *stack*, la duración de la *reserva* no - está atada a un bloque de código. -.. [#gcbuff] Un *buffer overflow* (*desbordamiento de memoria* en - castellano) se produce cuando se copia un dato a un área de memoria que - no es lo suficientemente grande para contenerlo. Esto puede producir que - el programa sea abortado por una violación de segmento, o peor, - sobreescribir un área de memoria válida, en cuyo caso los resultados son - impredecibles. -.. [#gcdang] Un *dangling pointer* (*puntero colgante* en castellano) es un - puntero que apunta a un área de memoria inválida. Ya sea porque el - elemento apuntado no es el mismo tipo o porque la memoria ya ha sido - liberada. Al ser desreferenciado, los resultados son impredecibles, el - programa podría abortarse por una violación de segmento o podrían pasar - peores cosas si el área de memoria fue realocada para almacenar otro - objeto. - Conceptos básicos @@ -121,6 +123,13 @@ Registros: celda [#gccelda]_ alocada antes que otra nunca puede ser liberada antes que aquella. + .. [#gccelda] En general en la literatura se nombra a una porción de + memoria alocada individualmente *celda*, *nodo* u *objeto* + indistintamente. En este trabajo se utilizará la misma nomenclatura + (haciendo mención explícita cuando alguno de estos términos se + refiera a otra cosa, como al nodo de una lista o a un objeto en el + sentido de programación orientada a objetos). + *Heap*: A diferencia del *stack*, el *heap* provee un área de memoria que puede ser obtenida dinámicamente pero sin limitaciones de orden. Es el tipo de @@ -173,13 +182,6 @@ programa en sí son los cambios al grafo de conectividad de las celdas, normalmente se lo llama *mutator* (mutador). -.. [#gccelda] En general en la literatura se nombra a una porción de - memoria alocada individualmente *celda*, *nodo* u *objeto* - indistintamente. En este trabajo se utilizará la misma nomenclatura - (haciendo mención explícita cuando alguno de estos términos se refiera - a otra cosa, como al nodo de una lista o a un objeto en el sentido de - programación orientada a objetos). - Recorrido del grafo de conectividad @@ -317,6 +319,11 @@ convenir uno u otro método para lograr una mejor localidad de referencia y de esta manera tener un mejor comportamiento de la memoria virtual o del *caché*. +.. [#gccycle] Un ciclo es un camino donde el *vértice inicial* es el mismo + que el *vértice final*. Por lo tanto, los *vértices terminales* son + completamente arbitrarios, ya que cualquier *vértice interior* puede ser + un *vértice terminal*. + Un algoritmo simple (recursivo) de marcado *primero a lo alto* puede ser el siguiente (asumiendo que partimos con todos los vértices sin marcar) [#gcpseudo]_:: @@ -331,6 +338,14 @@ el siguiente (asumiendo que partimos con todos los vértices sin marcar) for r in root_set mark(r) +.. [#gcpseudo] Para presentar los algoritmos se utiliza una forma simple de + pseudo-código. El pseudo-código se escribe en inglés para que pueda ser + más fácilmente contrastado con la literatura, que está en inglés. Para + diferenciar posiciones de memoria y punteros de las celdas en sí, se usa + la misma sintaxis que C, ``r*`` denota una referencia o puntero y ``*r`` + denota "objeto al que apunta ``r``\ ". Se sobreentiende que ``r = o`` + siempre toma la dirección de memoria de ``o``. + Una vez concluido el marcado, sabemos que todos los vértices con la marca son parte del *live set* y que todos los vértices no marcados son *basura*. Esto es conocido también como **abstracción bicolor**, dado que en la @@ -339,7 +354,7 @@ celda sin marcar es de color blanco y una marcada de color negro. Puede observarse un ejemplo del algoritmo en la figura :vref:`fig:gc-mark-1`, en la cual se marca el sub-grafo apuntando por -``r0``. Luego se marca el sub-grafo al que apunta ``r1`` (figura +``r0``. Luego se marca el sub-grafo al que apunta ``r1`` (ver figura :vref:`fig:gc-mark-2`), concluyendo con el marcado del grafo completo, dejando sin marcar solamente las celdas *basura* (en blanco). @@ -567,19 +582,6 @@ dejando sin marcar solamente las celdas *basura* (en blanco). } -.. [#gccycle] Un ciclo es un camino donde el *vértice inicial* es el mismo - que el *vértice final*. Por lo tanto, los *vértices terminales* son - completamente arbitrarios, ya que cualquier *vértice interior* puede ser - un *vértice terminal*. -.. [#gcpseudo] Para presentar los algoritmos se utiliza una forma simple de - pseudo-código. El pseudo-código se escribe en inglés para que pueda ser - más fácilmente contrastado con la literatura, que está en inglés. Para - diferenciar posiciones de memoria y punteros de las celdas en sí, se usa - la misma sintaxis que C, ``r*`` denota una referencia o puntero y ``*r`` - denota "objeto al que apunta ``r``\ ". Se sobreentiende que ``r = o`` - siempre toma la dirección de memoria de ``o``. - - .. _ref_gc_tricolor: @@ -635,6 +637,18 @@ En general todos los algoritmos de recolección de basura utilizan servicios de una capa inferior [#gclowlayer]_ y proveen servicios a una capa superior [#gchilayer]_. +.. [#gclowlayer] En general estos servicios están provistos directamente + por el sistema operativo pero también pueden estar dados por un + administrador de memoria de bajo nivel (o *low level allocator* en + inglés). + +.. [#gchilayer] En general estos servicios son utilizados directamente por + el lenguaje de programación, pero pueden ser utilizados directamente por + el usuario del lenguaje si éste interatúa con el recolector, ya sea por + algún requerimiento particular o porque el lenguaje no tiene soporte + diercto de recolección de basura y el recolector está implementado como + una biblioteca de usuario. + A continuación se presentan las primitivas en común que utilizan todos los recolectores a lo largo de este documento. @@ -697,17 +711,6 @@ recolector, aunque en ciertas circunstancias pueden ser utilizados por el usuario también. -.. [#gclowlayer] En general estos servicios están provistos directamente - por el sistema operativo pero también pueden estar dados por un - administrador de memoria de bajo nivel (o *low level allocator* en - inglés). -.. [#gchilayer] En general estos servicios son utilizados directamente por - el lenguaje de programación, pero pueden ser utilizados directamente por - el usuario del lenguaje si éste interatúa con el recolector, ya sea por - algún requerimiento particular o porque el lenguaje no tiene soporte - diercto de recolección de basura y el recolector está implementado como - una biblioteca de usuario. - .. _ref_gc_clasic: @@ -800,21 +803,56 @@ siguientes (acompañadas de una implementación básica):: *ref = cell + +.. _ref_gc_rc_cycles: + +Ciclos +^^^^^^ + +El conteo de referencias tiene, sin embargo, un problema fundamental: +**falla con estructuras cíclicas**. Esto significa que siempre que haya un +ciclo en el grafo de conectividad, hay una pérdida de memoria potencial en +el programa. Un ciclo es un camino :math:`\underset{v \to v}{C}`, es decir, +el *vértice inicial* es el mismo que el *vértice final*. + +Cuando esto sucede, las celdas que participan del ciclo tienen siempre su +contador mayor que 0, sin embargo puede no haber ningún elemento del *root +set* que apunte a una celda dentro del ciclo, por lo tanto el ciclo es +*basura* (al igual que cualquier otra celda que sea referenciada por el +ciclo pero que no tenga otras referencias externas) y sin embargo los +contadores no son 0. Los ciclos, por lo tanto, *rompen* la invariante del +conteo de referencia. + +Hay formas de solucionar esto, pero siempre recaen en un esquema que va por +fuera del conteo de referencias puro. En general los métodos para +solucionar esto son variados y van desde realizar un marcado del subgrafo +para detectar nodos hasta tener otro recolector completo de *emergencia*, +pasando por tratar los ciclos como un todo contar las referencias al ciclo +completo en vez de a cada celda en particular. + +Incluso con este problema, el conteo de referencia sin ningún tipo de +solución en cuanto a la detección y recolección de ciclos fue utilizado en +muchos lenguajes de programación sin que su necesidad sea tan evidente. Por +ejemplo Python_ agregó recolección de ciclos en la versión 2.0 [NAS00]_ +(liberada en octubre de 2000) y PHP_ recién agrega detección de ciclos en +la versión 5.3 (todavía no liberada al momento de escribir este documento) +[PHP081]_. + + + +.. _ref_gc_rc_example: + Ejemplo ^^^^^^^ A continuación se presenta un ejemplo gráfico para facilitar la comprensión del algoritmo. Por simplicidad se asumen celdas de tamaño fijo con dos -punteros, ``left`` y ``right`` y se muestra el contador de referencias -abajo del nombre de cada celda. Se parte con una pequeña estructura ya -construída y se muestra como opera el algoritmo al eliminar o cambiar una -referencia (cambios en la conectividad del grafo). - -Se comienza por eliminar la referencia de ``r0`` a ``h1``, que determina -que ``h1`` se convirtió en *basura* (figura :vref:`fig:gc-rc-rm-1`). Esto -conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el -*live set* ya que sus contadores siguen siendo mayores a 0 (figura -:vref:`fig:gc-rc-rm-2`). +punteros, ``left`` (``l``) y ``right`` (``r``) y se muestra el contador de +referencias abajo del nombre de cada celda. Se parte con una pequeña +estructura ya construída y se muestra como opera el algoritmo al eliminar +o cambiar una referencia (cambios en la conectividad del grafo). En un +comienzo todas las celdas son accesibles desde el *root set* por lo tanto +son todas parte del *live set*. .. fig:: fig:gc-rc-rm-1 @@ -823,13 +861,61 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el .. subfig:: - Se ejecuta ``update(r0, null)``. + Estado inicial del grafo de conectividad. .. digraph:: g3_1 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; + edge [ color = gray40 ]; + node [ + shape = record, + width = 0, + height = 0, + style = filled, + fillcolor = gray25, + fontcolor = white + ]; + + subgraph cluster_all { + + root [ + label = "root\nset| r0| r1", + style = filled, + fillcolor = gray96, + fontcolor = black, + ]; + + h1 [ label = "h1\n1| l| r" ]; + h2 [ label = "h2\n2| l| r" ]; + h3 [ label = "h3\n3| l| r" ]; + h4 [ label = "h4\n1| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; + + root:r0 -> h1; + root:r1 -> h3; + h1:l -> h2; + h1:r -> h3; + h2:l -> h4; + h2:r -> h5; + h3:l -> h2; + h3:r -> h6; + h6:r -> h3:r; + + } + + .. subfig:: + + Al ejecutarse ``update(r0, null)``, se comienza por visitar la celda + ``h1``. + + .. digraph:: g3_2 + + margin = 0; + ratio = fill; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -849,12 +935,12 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el fontcolor = black, ]; - h1 [ label = "h1\n1| left| right" ]; - h2 [ label = "h2\n2| left| right" ]; - h3 [ label = "h3\n2| left| right" ]; - h4 [ label = "h4\n1| left| right" ]; - h5 [ label = "h5\n1| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n1| l| r" ]; + h2 [ label = "h2\n2| l| r" ]; + h3 [ label = "h3\n3| l| r" ]; + h4 [ label = "h4\n1| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = bold, color = black ]; root:r1 -> h3; @@ -864,20 +950,20 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el h2:r -> h5; h3:l -> h2; h3:r -> h6; + h6:r -> h3:r; } .. subfig:: - Se decrementa el contador de ``h1`` y éste queda en 0 (indicando - que es basura). Esto desencadena la eliminación de las referencias - ``h1.left`` y ``h1.right``. + Se decrementa el contador de ``h1`` quedando en 0 (pasa a ser + *basura*). Se elimina primero ``h1.l`` y luego ``h1.r``. - .. digraph:: g3_2 + .. digraph:: g3_3 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -902,12 +988,12 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el h1; }; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n2| left| right" ]; - h3 [ label = "h3\n2| left| right" ]; - h4 [ label = "h4\n1| left| right" ]; - h5 [ label = "h5\n1| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n2| l| r" ]; + h3 [ label = "h3\n3| l| r" ]; + h4 [ label = "h4\n1| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; root:r1 -> h3; @@ -917,24 +1003,26 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el h2:r -> h5; h3:l -> h2; h3:r -> h6; + h6:r -> h3:r; } + .. fig:: fig:gc-rc-rm-2 + :padding: 0.5 Eliminación de la referencia ``r0`` :math:`\to` ``h1`` (parte 2). .. subfig:: - Se decrementa el contador de ``h2`` pero no queda en 0, por lo - tanto no es necesario descender a sus hijas; se continúa con - ``h3``. + Se decrementa el contador de ``h2`` pero no queda en 0 (permanece en + el *live set*). - .. digraph:: g3_3 + .. digraph:: g3_4 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -959,12 +1047,12 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el h1; }; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n1| left| right" ]; - h3 [ label = "h3\n2| left| right" ]; - h4 [ label = "h4\n1| left| right" ]; - h5 [ label = "h5\n1| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n1| l| r" ]; + h3 [ label = "h3\n3| l| r" ]; + h4 [ label = "h4\n1| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; root:r1 -> h3; @@ -974,19 +1062,19 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el h2:r -> h5; h3:l -> h2; h3:r -> h6; + h6:r -> h3:r; } .. subfig:: - El contador de ``h3`` tampoco queda en 0; no hay necesidad de - descender a sus hijas y finaliza el proceso. + El contador de ``h3`` tampoco queda en 0, sigue en el *live set*. - .. digraph:: g3_4 + .. digraph:: g3_5 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -1011,12 +1099,12 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el h1; }; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n1| left| right" ]; - h3 [ label = "h3\n1| left| right" ]; - h4 [ label = "h4\n1| left| right" ]; - h5 [ label = "h5\n1| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n1| l| r" ]; + h3 [ label = "h3\n2| l| r" ]; + h4 [ label = "h4\n1| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; root:r1 -> h3; @@ -1026,36 +1114,32 @@ conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el h2:r -> h5; h3:l -> h2; h3:r -> h6; + h6:r -> h3:r; } -Luego se cambia una referencia (en vez de eliminarse) realizándose la -operación ``update(h3.left, h5)``. Para esto primero se incrementa el -contador de referencias de ``h5`` para evitar confundirlo accidentalmente -con *basura* (figura :vref:`fig:gc-rc-up-1`). Luego se procede -a decrementar el contador de ``h2`` que queda en 0 (transformándose en -*basura*) y lo mismo pasa cuando se desciende a ``h4`` (figura -:vref:`fig:gc-rc-up-2`). Finalmente se decrementa el contador de ``h5`` -pero como esta celda va a ser apuntada por ``h3`` (por la operación que -está ejecutándose) sobrevive y permanece en el *live set*. Finalmente se -termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` -(figura :vref:`fig:gc-rc-up-3`). +Se comienza por eliminar la referencia de ``r0`` a ``h1``, que determina +que ``h1`` se convirtió en *basura* (ver figura :vref:`fig:gc-rc-rm-1`). Esto +conduce al decremento del contador de ``h2`` y ``h3`` que permanecen en el +*live set* ya que sus contadores siguen siendo mayores a 0 (ver figura +:vref:`fig:gc-rc-rm-2`). .. fig:: fig:gc-rc-up-1 - TODO Eliminación de la referencia ``r0`` :math:`\to` ``h1`` (parte 1). + Cambio en la referencia ``h2.l`` :math:`\to` ``h2`` a ``h2.l`` + :math:`\to` ``h5`` (parte 1). .. subfig:: - TODO + Comienza ``update(h3.l, h5)``, se incrementa el contador de ``h5``. .. digraph:: g4_1 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -1080,12 +1164,12 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h1; }; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n1| left| right" ]; - h3 [ label = "h3\n1| left\n*| right" ]; - h4 [ label = "h4\n1| left| right" ]; - h5 [ label = "h5\n1| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n1| l| r" ]; + h3 [ label = "h3\n2| l\n*| r" ]; + h4 [ label = "h4\n1| l| r" ]; + h5 [ label = "h5\n2| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; h1:l -> h2 [ style = invis ]; @@ -1093,20 +1177,22 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` root:r1 -> h3; h2:l -> h4; h2:r -> h5; - h3:l -> h2 [ style = bold, color = black ]; + h3:l -> h2; + h3:l -> h5 [ style = dotted, color = black ]; h3:r -> h6; + h6:r -> h3:r; } .. subfig:: - TODO + Luego se procede a visitar las hijas de ``h3``, comenzando por ``h2``. .. digraph:: g4_2 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -1131,12 +1217,12 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h1; }; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n1| left| right" ]; - h3 [ label = "h3\n1| left\n*| right" ]; - h4 [ label = "h4\n1| left| right" ]; - h5 [ label = "h5\n2| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n1| l| r" ]; + h3 [ label = "h3\n2| l\n*| r" ]; + h4 [ label = "h4\n1| l| r" ]; + h5 [ label = "h5\n2| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; h1:l -> h2 [ style = invis ]; @@ -1147,22 +1233,20 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h3:l -> h2 [ style = bold, color = black ]; h3:l -> h5 [ style = dotted, color = black ]; h3:r -> h6; + h6:r -> h3:r; } -.. fig:: fig:gc-rc-up-2 - - TODO Eliminación de la referencia ``r0`` :math:`\to` ``h1`` (parte 2). - .. subfig:: - TODO + Se decrementa el contador de ``h2`` y queda en 0 (pasa a ser + *basura*). Se eliminan las referencias a las hijas. .. digraph:: g4_3 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -1187,12 +1271,12 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h1; h2; }; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n0| left| right" ]; - h3 [ label = "h3\n1| left\n*| right" ]; - h4 [ label = "h4\n1| left| right" ]; - h5 [ label = "h5\n2| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n1| l| r" ]; + h3 [ label = "h3\n2| l\n*| r" ]; + h4 [ label = "h4\n1| l| r" ]; + h5 [ label = "h5\n2| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; h1:l -> h2 [ style = invis ]; @@ -1203,18 +1287,26 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h3:l -> h2 [ style = invis ]; h3:l -> h5 [ style = dotted, color = black ]; h3:r -> h6; + h6:r -> h3:r; } + +.. fig:: fig:gc-rc-up-2 + + Cambio en la referencia ``h2.l`` :math:`\to` ``h2`` a ``h2.l`` + :math:`\to` ``h5`` (parte 2). + .. subfig:: - TODO + Se decrementa el contador de ``h4`` quedando en 0, pasa a ser + *basura*. Se continúa con ``h5``. .. digraph:: g4_4 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -1239,12 +1331,12 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h1; h2; h4; }; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n0| left| right" ]; - h3 [ label = "h3\n1| left\n*| right" ]; - h4 [ label = "h4\n0| left| right" ]; - h5 [ label = "h5\n2| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n1| l| r" ]; + h3 [ label = "h3\n2| l\n*| r" ]; + h4 [ label = "h4\n0| l| r" ]; + h5 [ label = "h5\n2| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; h1:l -> h2 [ style = invis ]; @@ -1255,22 +1347,19 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h3:l -> h2 [ style = invis ]; h3:l -> h5 [ style = dotted, color = black ]; h3:r -> h6; + h6:r -> h3:r; } -.. fig:: fig:gc-rc-up-3 - - TODO Eliminación de la referencia ``r0`` :math:`\to` ``h1`` (parte 3). - .. subfig:: - TODO + Se decrementa el contador de ``h5`` pero sigue siendo mayor que 0. .. digraph:: g4_5 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -1295,12 +1384,12 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h1; h2; h4; }; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n0| left| right" ]; - h3 [ label = "h3\n1| left\n*| right" ]; - h4 [ label = "h4\n0| left| right" ]; - h5 [ label = "h5\n1| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n1| l| r" ]; + h3 [ label = "h3\n2| l\n*| r" ]; + h4 [ label = "h4\n0| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; h1:l -> h2 [ style = invis ]; @@ -1311,18 +1400,20 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h3:l -> h5 [ style = bold, color = black ]; h3:l -> h2 [ style = invis ]; h3:r -> h6; + h6:r -> h3:r; } .. subfig:: - TODO + Se termina por actualizar la referencia de ``h3.l`` para que apunte + a ``h5``. .. digraph:: g4_6 margin = 0; ratio = fill; - size = "3.0,3.8"; + size = "1.9,2.6"; edge [ color = gray40 ]; node [ shape = record, @@ -1347,13 +1438,13 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h1; h2; h4; }; - h1 [ label = "h1\n0| left| right" ]; - h1 [ label = "h1\n0| left| right" ]; - h2 [ label = "h2\n0| left| right" ]; - h3 [ label = "h3\n1| left| right" ]; - h4 [ label = "h4\n0| left| right" ]; - h5 [ label = "h5\n1| left| right" ]; - h6 [ label = "h6\n1| left| right" ]; + h1 [ label = "h1\n0| l| r" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n0| l| r" ]; + h3 [ label = "h3\n2| l| r" ]; + h4 [ label = "h4\n0| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; root:r0 -> h1 [ style = invis ]; h1:l -> h2 [ style = invis ]; @@ -1364,13 +1455,151 @@ termina de actualizar la referencia ``h3.left`` para que apunte a ``h5`` h3:l -> h5; h3:l -> h2 [ style = invis ]; h3:r -> h6; + h6:r -> h3:r; + + } + + +Luego se cambia una referencia (en vez de eliminarse) realizándose la +operación ``update(h3.l, h5)``. Para esto primero se incrementa el contador +de referencias de ``h5`` para evitar confundirlo accidentalmente con +*basura* si se elimina alguna celda que apuntaba a ésta. Luego se procede +a decrementar el contador de ``h2`` que queda en 0, transformándose en +*basura* (ver figura :vref:`fig:gc-rc-up-1`). Lo mismo pasa cuando se +desciende a ``h4``, pero al descender a ``h5`` y decrementar el contador, +éste sigue siendo mayor que 0 (pues ``h3`` va a apuntar a ``h5``) así que +permanece en el *live set*. Finalmente se termina de actualizar la +referencia ``h3.l`` para que apunte a ``h5`` (ver figura +:vref:`fig:gc-rc-up-2`). + + +.. fig:: fig:gc-rc-cycle + :padding: 0.5 + + Eliminación de la referencia ``r1`` :math:`\to` ``h3`` (pérdida de + memoria debido a un ciclo). + + .. subfig:: + + El ejecutarse ``update(r1, null)`` se visita la celda ``h3``. + + .. digraph:: g4_6 + + margin = 0; + ratio = fill; + size = "1.9,2.6"; + edge [ color = gray40 ]; + node [ + shape = record, + width = 0, + height = 0, + style = filled, + fillcolor = gray25, + fontcolor = white + ]; + + subgraph cluster_all { + + root [ + label = "root\nset| r0| r1\n*", + style = filled, + fillcolor = gray96, + fontcolor = black, + ]; + + subgraph marked { + node [ fillcolor = white, fontcolor = black ]; + h1; h2; h4; + }; + + h1 [ label = "h1\n0| l| r" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n0| l| r" ]; + h3 [ label = "h3\n2| l| r" ]; + h4 [ label = "h4\n0| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; + + root:r0 -> h1 [ style = invis ]; + h1:l -> h2 [ style = invis ]; + h1:r -> h3 [ style = invis ]; + root:r1 -> h3 [ style = bold, color = black ]; + h2:l -> h4 [ style = invis ]; + h2:r -> h5 [ style = invis ]; + h3:l -> h5; + h3:l -> h2 [ style = invis ]; + h3:r -> h6; + h6:r -> h3:r; } + .. subfig:: + + Se decrementa el contador de ``h3`` pero sigue siendo mayor que 0 por + el ciclo. + + .. digraph:: g5_2 + + margin = 0; + ratio = fill; + size = "1.9,2.6"; + edge [ color = gray40 ]; + node [ + shape = record, + width = 0, + height = 0, + style = filled, + fillcolor = gray25, + fontcolor = white + ]; + + subgraph cluster_all { + + root [ + label = "root\nset| r0| r1\n*", + style = filled, + fillcolor = gray96, + fontcolor = black, + ]; + + subgraph marked { + node [ fillcolor = white, fontcolor = black ]; + h1; h2; h4; + }; + + h1 [ label = "h1\n0| l| r" ]; + h1 [ label = "h1\n0| l| r" ]; + h2 [ label = "h2\n0| l| r" ]; + h3 [ label = "h3\n1| l| r" ]; + h4 [ label = "h4\n0| l| r" ]; + h5 [ label = "h5\n1| l| r" ]; + h6 [ label = "h6\n1| l| r" ]; + + root:r0 -> h1 [ style = invis ]; + h1:l -> h2 [ style = invis ]; + h1:r -> h3 [ style = invis ]; + root:r1 -> h3 [ style = invis ]; + h2:l -> h4 [ style = invis ]; + h2:r -> h5 [ style = invis ]; + h3:l -> h5; + h3:l -> h2 [ style = invis ]; + h3:r -> h6; + h6:r -> h3:r; + + } + + +Finalmente se presenta lo que sucede cuando se elimina la última referencia +a un ciclo (en este caso un ciclo simple de 2 celdas: ``h3`` y ``h6``). Se +elimina la única referencia externa al ciclo (``r1``), por lo que se visita +la celda ``h3`` decrementando su contador de referencias, pero éste +continúa siendo mayor que 0 porque la celda ``h6`` (parte del ciclo) la +referencia. Por lo tanto el ciclo, y todas las celdas a las que apunta que +no tienen otras referencias externas y por lo tanto deberían ser *basura* +también (``h5``), no pueden ser recicladas y su memoria es perdida (ver +figura :vref:`fig:gc-rc-cycle`). -.. _ref_gc_cycles: -TODO El problema de los ciclos Marcado y barrido @@ -1387,15 +1616,18 @@ TODO -Compactado -~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ +.. _ref_gc_art: -TODO +Estado del arte +---------------------------------------------------------------------------- +.. explicar la cantidad de cosas que hay (que son muchas) y dar algunos + ejemplos. +TODO Clasificación ----------------------------------------------------------------------------- +~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ La cantidad de clasificaciones que pueden hacerse respecto a algoritmos de recolección de basura son muy grandes. Muchas de estas clasificaciones se @@ -1409,7 +1641,7 @@ pudieron observar en la investigación sobre el `estado del arte`_. .. _ref_gc_direct: Directa / indirecta -~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ +^^^^^^^^^^^^^^^^^^^ Generalmente se llama recolección **directa** a aquella en la cual el compilador o lenguaje instrumenta al *mutator* de forma tal que la @@ -1417,7 +1649,7 @@ información de conectividad se mantenga activamente cada vez que hay un cambio en él. Normalmente se utiliza un contador de referencia en cada celda para este propósito, permitiendo almacenar en todo momento la cantidad de nodos que apuntan a ésta (dejando de lado el :ref:`problema de -los ciclos `). Esto permite reclamar una celda +los ciclos `). Esto permite reclamar una celda instantáneamente cuando el *mutator* deja de hacer referencia a ella. Este tipo de recolectores son, inherentemente :ref:`incrementales `. @@ -1439,7 +1671,7 @@ Estas son las dos grandes familias de recolectores, también conocidos como .. _ref_gc_inc: Incremental -~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ +^^^^^^^^^^^ Recolección incremental es aquella que se realiza de forma intercalada con el *mutator*. En general el propósito es disminuir el tiempo de las pausas @@ -1467,7 +1699,7 @@ incremental, aunque el tiempo de pausa de una recolección sea menor. .. _ref_gc_concurrent: Concurrente / *stop-the-world* -~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ +^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ Los recolectores concurrentes son aquellos que pueden correr en paralelo con el *mutator*. Por el contrario, aquellos que pausan el *mutator* para @@ -1485,15 +1717,6 @@ Esto también trae como consecuencia el incremento en el tiempo total que consume el recolector, debido a la necesidad de re-escanear sub-grafos que han sido modificados. -.. _ref_gc_art: - -Estado del arte ----------------------------------------------------------------------------- - -.. explicar la cantidad de cosas que hay (que son muchas) y dar algunos - ejemplos. - -TODO Cloning @@ -1551,4 +1774,4 @@ http://www.hpl.hp.com/personal/Hans_Boehm/gc/gcinterface.html .. include:: links.rst -.. vim: set ts=3 sts=3 sw=3 et tw=75 : +.. vim: set ts=3 sts=3 sw=3 et tw=78 :