X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/4d68710ea4b4e170388f7437e5853b2cd357e922..8467f5df997cd28332cbd57ad5917b6bfb287365:/source/dgc.rst

diff --git a/source/dgc.rst b/source/dgc.rst
index 941a4fd..a457444 100644
--- a/source/dgc.rst
+++ b/source/dgc.rst
@@ -4,7 +4,7 @@
    de recolecciÃ³n de basura en dicho lenguaje (se explica por quÃ© las
    particularidades descriptas en la secciÃ³n anterior complican la
    recolecciÃ³n de basura y cuales son las que mÃ¡s molestan).
-   ESTADO: SIN EMPEZAR, REVISAR LO HECHO
+   ESTADO: TERMINADO
 
 
 .. _dgc:
@@ -12,14 +12,160 @@
 RecolecciÃ³n de basura en D
 ============================================================================
 
-TODO
+D_ propone un nuevo desafÃ­o en cuanto al diseÃ±o de un recolector de basura,
+debido a la gran cantidad caracterÃ­sticas que tiene y paradigmas que soporta.
 
+D_ ya cuenta con un recolector que hace lo necesario para funcionar de forma
+aceptable, pero su diseÃ±o e implementaciÃ³n son relativamente sencillas
+comparadas con el :ref:`estado del arte <gc_art>` de la recolecciÃ³n de basura
+en general. AdemÃ¡s la implementaciÃ³n actual presenta una serie de problemas
+que se evidencia en las quejas que regularmente la comunidad de usuarios de D_
+menciona en el grupo de noticias.
 
+En esta secciÃ³n se analizarÃ¡n las necesidades particulares de D_ con respecto
+a la recolecciÃ³n de basura. TambiÃ©n se analiza el diseÃ±o e implementaciÃ³n del
+recolector actual y finalmente se presenta una recompilaciÃ³n de los
+principales problemas que presenta.
 
-Dificultades para recolectar basura en D
+
+
+.. _dgc_needs:
+
+CaracterÃ­sticas y necesidades particulares de D_
 ----------------------------------------------------------------------------
 
-TODO
+En esta secciÃ³n se harÃ¡ un recorrido por las caracterÃ­sticas y necesidades
+particulares que tiene D_ como lenguaje con respecto a la recolecciÃ³n de
+basura.
+
+
+
+.. _dgc_prob_low_level:
+
+ProgramaciÃ³n de bajo nivel (*system programming*)
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+Sin dudas las caracterÃ­sticas de D_ que lo hacen mÃ¡s complejo a la hora de
+implementar un recolector de basura son sus capacidades de programaciÃ³n de
+bajo nivel (ver :ref:`d_low_level`).
+
+Al proveer acceso a *aasembly*, permitir estructuras de tipo *union* y ser
+compatible con C/C++, el recolector de basura tiene muchas restricciones. Por
+ejemplo debe tratar de forma conservativa los registros y el *stack*, ya que
+es la Ãºnica forma de interactuar de forma segura con C/C++ y *assembly*.
+
+AdemÃ¡s debe poder interactuar con manejo de memoria explÃ­cito, ya sea
+omitiendo por completo el *heap* del recolector o liberando explÃ­citamente
+memoria de Ã©ste. Esta caracterÃ­stica es muy inusual en un recolector,
+a excepciÃ³n de recolectores conservativos diseÃ±ados para C/C++ que tienen las
+mismas (o mÃ¡s) limitaciones.
+
+El control sobre la alineaciÃ³n de memoria es otra complicaciÃ³n sobre el
+recolector de basura, incluso aunque Ã©ste sea conservativo. Dado que tratar la
+memoria de forma conservativa byte a byte serÃ­a impracticable (tanto por la
+cantidad de falsos positivos que esto provocarÃ­a como por el impacto en la
+eficiencia por el exceso de posibles punteros a revisar, ademÃ¡s de lo
+ineficiente que es operar sobre memoria no alineada), en general el recolector
+asume que el usuario nunca va a tener la Ãºnica referencia a un objeto en una
+estructura no alineada al tamaÃ±o de palabra.
+
+
+
+.. _d_prob_high_level:
+
+ProgramaciÃ³n de alto nivel
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+Las caracterÃ­sticas de programaciÃ³n de alto nivel tambiÃ©n impone dificultades
+o restricciones al recolector de basura (ver :ref:`d_high_level`). Por ejemplo
+el soporte de rebanado (*slicing*) de arreglos hace que el recolector deba
+soportar punteros *interiores* [#dgcinterior]_ (esto tambiÃ©n es necesario
+porque en general en D_ o en cualquier lenguaje de bajo nivel se puede tener
+un puntero a cualquier parte de una celda).
+
+.. [#dgcinterior] Los punteros *interiores* son aquellos que en vez de apuntar
+   al inicio de una celda, apuntan a una direcciÃ³n arbitraria dentro de ella.
+   Esto no es posible en muchos lenguajes de programaciÃ³n, como por ejemplo
+   Java_, lo que simplifica la recolecciÃ³n de basura.
+
+Los arreglos dinÃ¡micos y asociativos en particular dependen fuertemente del
+recolector de basura, en particular cuando se agregan elementos (o se
+concatenan dos arreglos).
+
+Dado que los *strings* son arreglos dinÃ¡micos y que el lenguaje provee un buen
+soporte de arreglos dinÃ¡micos y asociativos y *slicing*, es de esperarse que
+el recolector deba comportarse de forma correcta y eficiente ante las
+operaciones mÃ¡s tÃ­picas de estas estructuras que dependan de Ã©l.
+
+
+
+.. _dgc_prob_types:
+
+InformaciÃ³n de tipos
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+Hasta aquÃ­ D_ comparte todas las restricciones con respecto a la recolecciÃ³n
+de basura con los lenguajes de bajo nivel que no tienen ningÃºn soporte para
+recolectar basura. Sin embargo, a diferencia de Ã©stos, D_ tiene una
+informaciÃ³n de tipos mÃ¡s rica. Al momento de asignar memoria D_ puede proveer
+cierta informaciÃ³n sobre el objeto a asignar (como si puede contener punteros
+o no) que puede ser utilizada por el recolector para realizar una recolecciÃ³n
+mÃ¡s precisa (ver :ref:`gc_conserv`).
+
+En general esta informaciÃ³n no es suficiente como para implementar un
+recolector completamente preciso (no al menos sin agregar un mejor soporte de
+reflexiÃ³n al lenguaje) pero puede ser de ayuda considerable para el
+recolector.
+
+
+
+.. _dgc_prob_final:
+
+OrientaciÃ³n a objetos y finalizaciÃ³n
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+D_ soporta el paradigma de orientaciÃ³n a objetos, donde es comÃºn permitir que
+un objeto, al ser destruido, realice alguna tarea de finalizaciÃ³n (a travÃ©s de
+una funciÃ³n miembro llamada *destructor*, o ``~this()`` en D_). Esto significa
+que el recolector, al encontrar que un objeto no es mÃ¡s referenciados, debe
+ejecutar el destructor.
+
+La especificaciÃ³n dice:
+
+   The garbage collector is not guaranteed to run the destructor for all
+   unreferenced objects. Furthermore, the order in which the garbage collector
+   calls destructors for unreference objects is not specified. This means that
+   when the garbage collector calls a destructor for an object of a class that
+   has members that are references to garbage collected objects, those
+   references may no longer be valid. This means that destructors cannot
+   reference sub objects.
+
+Afortunadamente el orden de finalizaciÃ³n no estÃ¡ definido, ya que esto serÃ­a
+extremadamente difÃ­cil de proveer por un recolector (si no imposible). Esto
+significa que si bien se ejecutan el destructores de los objetos que dejan de
+ser alcanzables desde el *root set*, no se define en que orden se hace, y por
+lo tanto un objeto no puede acceder a sus atributos que sean referencias
+a otros objetos en un destructor.
+
+Esta restricciÃ³n en realidad se ve relaja con el soporte de *RAII*. Si se
+utiliza la palabra clave ``scope`` al crear una serie de objetos, estos serÃ¡n
+destruÃ­dos determinÃ­sticamente al finalizar el *scope* actual en el orden
+inverso al que fueron creados y, por lo tanto, un usuario podrÃ­a hacer uso de
+los atributos que sean referencias a otros objetos creados con ``scope`` si el
+orden en que fueron creados (y por lo tanto en que serÃ¡n destruidos) se lo
+permite.
+
+Sin embargo no hay forma actualmente de saber dentro de un destructor si este
+fue llamado determinÃ­sticamente o no, por lo tanto es virtualmente imposible
+hacer uso de esta distinciÃ³n, a menos que una clase sea declarada para ser
+creada solamente utilizando la palabra reservada ``scope``.
+
+Cabe aclarar que estrictamente hablando, segÃºn la especificaciÃ³n de D_, el
+recolector no debe garantizar la finalizaciÃ³n de objetos bajo ninguna
+circunstancia, es decir, el recolector podrÃ­a no llamar a ningÃºn destructor.
+Sin embargo esto es probablemente un problema de redacciÃ³n vaga y dadas las
+garantÃ­as que provee la implementaciÃ³n actual la comunidad de D_ cuenta con
+ellas porque ademÃ¡s son deseables (y sencillas de implementar).
 
 
 
@@ -790,94 +936,787 @@ objetos sean finalizados.
 Detalles de implementaciÃ³n
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
-.. AcÃ¡ dirÃ­a por quÃ© hay que reescribirlo para usar lo que estÃ¡
+Hay varias diferencias a nivel de implementaciÃ³n entre lo que se presentÃ³ en
+las secciones anteriores y como estÃ¡ implementado realmente el recolector
+actual. Con los conceptos e ideas principales del ya explicadas, se procede
+a ahondar con mÃ¡s detalle en como estÃ¡ construÃ­do el recolector y algunas de
+sus optimizaciones principales.
+
+Vale aclarar que el recolector de basura actual estÃ¡ implementado en D_.
+
+
+Estructuras de datos del recolector
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+El recolector estÃ¡ principalmente contenido en la estructura llamada ``Gcx``.
+Dicha estructura tiene los siguientes atributos (divididos en categorÃ­as para
+facilitar la comprensiÃ³n):
+
+**RaÃ­ces definidas por el usuario**
+
+   *roots* (*nroots*, *rootdim*):
+      arreglo variable de punteros simples que son tomados como raÃ­ces
+      provistas por el usuario.
+
+   *ranges* (*nranges*, *rangedim*):
+      arreglo variable de rangos de memoria que deben ser revisados (de forma
+      conservativa) como raÃ­ces provistas por el usuario. Un rango es una
+      estructura con dos punteros: ``pbot`` y ``ptop``. Toda la memoria entre
+      estos dos punteros se toma, palabra por palabra, como una raÃ­z del
+      recolector.
+
+**Estado interno del recolector**
+
+   *anychanges*:
+      variable que indica si en la fase de marcado se encontraron nuevas
+      celdas con punteros que deban ser visitados. Otra forma de verlo es como
+      un indicador de si el conjunto de celdas *grises* estÃ¡ vacÃ­o luego de
+      una iteraciÃ³n de marcado (utilizando la :ref:`abstracciÃ³n tricolor
+      <gc_intro_tricolor>`). Es anÃ¡loga a la variable ``more_to_scan``
+      presentada en :ref:`dgc_algo_mark`.
+
+   *inited*:
+      indica si el recolector fue inicializado.
+
+   *stackBottom*:
+      puntero a la base del *stack* (asumiendo que el stack crece hacia arriba).
+      Se utiliza para saber por donde comenzar a visitar el *stack* de forma
+      conservativa, tomÃ¡ndolo con una raÃ­z del recolector.
+
+   *Pools* (*pooltable*, *npools*):
+      arreglo variable de punteros a estructuras ``Pool`` (ver mÃ¡s adelante).
+      Este arreglo se mantiene siempre ordenado de menor a mayor segÃºn la
+      direcciÃ³n de memoria de la primera pÃ¡gina que almacena.
+
+   *bucket*:
+      listas de libres. Es un arreglo de estructuras ``List`` utilizadas para
+      guardar la listas de libres de todos los tamaÃ±os de bloques posibles (ver
+      mÃ¡s adelante).
+
+**Atributos que cambian el comportamiento**
+
+   *noStack*:
+      indica que no debe tomarse al *stack* como raÃ­z del recolector. Esto es
+      muy poco seguro y no deberÃ­a ser utilizado nunca, salvo casos
+      extremadamente excepcionales.
+
+   *log*:
+      indica si se debe guardar un registro de la actividad del recolector. Es
+      utilizado principalmente para depuraciÃ³n.
+
+   *disabled*:
+      indica que no se deben realizar recolecciones implÃ­citamente. Si al
+      tratar de asignar memoria no se puede hallar celdas libres en el *heap*
+      del recolector, se pide mÃ¡s memoria al sistema operativo sin correr una
+      recolecciÃ³n para intentar recuperar espacio. Esto es particularmente
+      Ãºtil para secciones de un programa donde la eficiencia es crÃ­tica y no
+      se pueden tolerar grandes pausas como las que puede provocar el
+      recolector.
+
+**Optimizaciones**
+
+   *p_cache*, *size_cache*:
+      obtener el tamaÃ±o de un bloque dado un puntero es una tarea costosa
+      y comÃºn. Para evitarla en casos donde se calcula de forma sucesiva el
+      tamaÃ±o del mismo bloque (como puede ocurrir al concatenar arreglos
+      dinÃ¡micos) se guarda el Ãºltimo calculado en estas variables a modo de
+      *cachÃ©*.
+
+   *minAddr*, *maxAddr*:
+      punteros al principio y fin del *heap*. Pueden haber *huecos* entre
+      estos dos punteros que no pertenezcan al *heap* pero siempre se cumple
+      que si un puntero apunta al *heap* debe estar en este rango. Esto es
+      Ãºtil para hacer un cÃ¡lculo rÃ¡pido para descartar punteros que fueron
+      tomados de forma conservativa y en realidad no apuntan al *heap* (ver la
+      funciÃ³n ``find_block()`` en :ref:`dgc_algo_mark`).
+
+
+*Pools*
+^^^^^^^
+La primera diferencia es como estÃ¡ organizado el *heap*. Si bien la
+explicaciÃ³n presentada en la secciÃ³n :ref:`dgc_org` es correcta, la forma en
+la que estÃ¡ implementado no es tan *naÃ¯ve* como los algoritmos presentados en
+:ref:`dgc_algo` sugieren.
+
+El recolector guarda un arreglo variable de estructuras ``Pool``. Cabe
+destacar que para implementar el recolector no se pueden utilizar los arreglos
+dinÃ¡micos de D_ (ver secciÃ³n :ref:`d_high_level`) dado que Ã©stos utilizan de
+forma implÃ­cita el recolector de basura, por lo tanto todos los arreglos
+variables del recolector se implementan utilizando las funciones de
+C ``malloc()``, ``realloc()`` y ``free()`` directamente.
+
+
+La estructura ``Pool`` estÃ¡ compuesta por los siguientes atributos (ver figura
+:vref:`fig:dgc-pool`):
+
+*baseAddr* y *topAddr*:
+   punteros al comienzo y fin de la memoria que almacena todas las pÃ¡ginas del
+   *pool* (*baseAddr* es anÃ¡logo al atributo *pages* utilizado en las
+   secciones anteriores para mayor claridad).
+
+*mark*, *scan*, *freebits*, *finals*, *noscan*:
+   conjunto de bits (*bitsets*) para almacenar los indicadores descriptos en
+   :ref:`dgc_org` para todos los bloques de todas las pÃ¡ginas del *pool*.
+   *freebits* es anÃ¡logo a *free* y *finals* a *final* en los atributos
+   descriptos en las secciones anteriores.
+
+*npages*:
+   cantidad de pÃ¡ginas que contiene este *pool* (fue nombrado
+   *number_of_pages* en las secciones anteriores para mayor claridad).
+
+*ncommitted*:
+   cantidad de pÃ¡ginas *encomendadas* al sistema operativo (*committed* en
+   inglÃ©s). Este atributo no se mencionÃ³ anteriormente porque el manejo de
+   pÃ¡ginas encomendadas le agrega una complejidad bastante notable al
+   recolector y es solo una optimizaciÃ³n para un sistema operativo en
+   particular (Microsoft Windows).
+
+*pagetable*:
+   arreglo de indicadores de tamaÃ±o de bloque de cada pÃ¡gina de este *pool*.
+   Los indicadores vÃ¡lidos son ``B_16`` a ``B_2048`` (pasando por los valores
+   posibles de bloque mencionados anteriormente, todos con el prefijo
+   "``B_``"), ``B_PAGE``, ``B_PAGEPLUS`` (anÃ¡logo a ``CONTINUATION``),
+   ``B_UNCOMMITTED`` (valor que tienen las pÃ¡ginas que no fueron encomendadas
+   aÃºn) y ``B_FREE``.
+
+.. fig:: fig:dgc-pool
+
+   Vista grÃ¡fica de la estructura de un *pool* de memoria.
 
-TODO
+   .. aafig::
+      :scale: 1.4
+      :aspect: 0.45
 
+                /---  "baseAddr"    "ncommitted = i"          "topAddr" ---\
+                |                       V                                  |
+                |/                      |/                                 |/
+                +----  "committed" -----+-------  "no committed" ----------+
+               /|                      /|                                 /|
+                V                       V                                  V
+                +--------+--------+-----+--------+-----+-------------------+
+        pÃ¡ginas |   0    |   0    | ... |   i    | ... |    "npages - 1"   |
+                +--------+--------+-----+--------+-----+-------------------+
+                    A        A      A       A      A           A
+                    |        |      |       |      |           |
+                +--------+--------+-----+--------+-----+-------------------+
+      pagetable | Bins 0 | Bins 1 | ... | Bins i | ... | "Bins (npages-1)" |
+                +--------+--------+-----+--------+-----+-------------------+
+
+Como se observa, ademÃ¡s de la informaciÃ³n particular del *pool* se almacena
+toda la informaciÃ³n de pÃ¡ginas y bloques enteramente en el *pool* tambiÃ©n.
+Esto simplifica el manejo de que lo es memoria *pura* del *heap*, ya que queda
+una gran porciÃ³n contÃ­nua de memoria sin estar intercalada con
+meta-informaciÃ³n del recolector.
 
+Para poder acceder a los bits de un bloque en particular, se utiliza la
+siguiente cuenta para calcular el Ã­ndice en el *bitset*:
 
-Problemas y limitaciones
-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+.. math::
 
-TODO
+   index(p) = \frac{p - baseAddr}{16}
 
+Donde ``p`` es la direcciÃ³n de memoria del bloque. Esto significa que, sin
+importar cual es el tamaÃ±o de bloque de las pÃ¡ginas del *pool*, el *pool*
+siempre reserva suficientes bits como para que todas las pÃ¡ginas puedan tener
+tamaÃ±o de bloque de 16 bytes. Esto puede ser desperdiciar bastante espacio si
+no predomina un tamaÃ±o de bloque pequeÃ±o.
+
+
+Listas de libres
+^^^^^^^^^^^^^^^^
+Las listas de libres se almacenan en el recolector como un arreglo de
+estructuras ``Lista``, que se compone solamente de un atributo ``List* next``
+(es decir, un puntero al siguiente). Entonces cada elemento de ese arreglo es
+un puntero al primer elemento de la lista en particular.
+
+La implementaciÃ³n utiliza a los bloques de memoria como nodos directamente.
+Como los bloques siempre pueden almacenar una palabra (el bloque de menor
+tamaÃ±o es de 16 bytes y una palabra ocupa comunmente entre 4 y 8 bytes segÃºn
+se trabaje sobre arquitecturas de 32 o 64 bits respectivamente), se almacena
+el puntero al siguiente en la primera palabra del bloque.
 
 
+Algoritmos
+^^^^^^^^^^
+Los algoritmos en la implementaciÃ³n real estÃ¡n considerablemente menos
+modularizados que los presentados en la secciÃ³n :ref:`dgc_algo`. Por ejemplo,
+la funciÃ³n ``collect()`` es una gran funciÃ³n de 300 lÃ­neas de cÃ³digo.
 
-Como se ha visto, D_ es un lenguaje de programaciÃ³n muy completo, pero aÃºn
-tiene algunos aspectos inconclusos. Su recolector de basura estÃ¡ en un estado
-de evoluciÃ³n muy temprana. Se trata de un marcado y barrido (*mark and sweep*)
-conservativo que, en ciertas circunstancias, no se comporta como es debido, ya
-que revisa toda la memoria del programa en busca de referencias a objetos en
-el *heap* (en vez de revisar sÃ³lo las partes que almacenan punteros). Esto
-produce que, en ciertos casos, por ejemplo al almacenar arreglos de nÃºmero
-o *strings* en la pila, el recolector de basura se encuentre con *falsos
-positivos*, pensando que un Ã¡rea del *heap* estÃ¡ siendo utilizada cuando en
-realidad el puntero que hacÃ­a referencia a Ã©sta no era tal. Este efecto puede
-llevar a la pÃ©rdida de memoria masiva, llegando al lÃ­mite de que eventualmente
-el sistema operativo tenga que matar al programa por falta de memoria
-[DNG46407]_. AÃºn cuando el programa no tenga estos problemas de por sÃ­, por
-usar datos que no pueden ser confundidos con direcciones de memoria, este
-problema podrÃ­a ser explotado por ataques de seguridad, inyectando valores que
-sÃ­ sean punteros vÃ¡lidos y provocando el efecto antes mencionado que deriva en
-la terminaciÃ³n abrupta del programa [DNG35364]_.  Finalmente, a estos problemas
-se suman los problemas de *performance* [DNG43991]_.
+A continuaciÃ³n se resumen las funciones principales, separadas en categorÃ­as
+para facilitar la comprensiÃ³n. Los siguientes son mÃ©todos de la estructura
+``Gcx``:
+
+**InicializaciÃ³n y terminaciÃ³n**
+
+   *initialize()*:
+      inicializa las estructuras internas del recolector para que pueda ser
+      utilizado. Esta funciÃ³n la llama la biblioteca *runtime* antes de que el
+      programa comience a correr.
+
+   *Dtor()*:
+       libera todas las estructuras que utiliza el recolector.
+
+**ManipulaciÃ³n de raÃ­ces definidas por el usuario**
+
+   *addRoot(p)*, *removeRoot(p)*, *rootIter(dg)*:
+      agrega, remueve e itera sobre las raÃ­ces simples definidas por el
+      usuario.
+
+   *addRange(pbot, ptop)*, *remove range(pbot)*, *rangeIter(dg)*:
+      agrega, remueve e itera sobre los rangos de raÃ­ces definidas por el
+      usuario.
+
+**ManipulaciÃ³n de indicadores**
+
+   Cada bloque (*bin* en la terminologÃ­a de la implementaciÃ³n del recolector)
+   tiene ciertos indicadores asociados. Algunos de ellos pueden ser
+   manipulados (indirectamente) por el usuario utilizando estas funciones:
+
+   *getBits(pool, biti)*:
+      obtiene los indicadores especificados para el bloque de Ã­ndice ``biti``
+      en el *pool* ``pool``.
+
+   *setBits(pool, biti, mask)*:
+      establece los indicadores especificados en ``mask`` para el bloque de
+      Ã­ndice ``biti`` en el *pool* ``pool``.
+
+   *clrBits(pool, biti, mask)*:
+      limpia los indicadores especificados en ``mask`` para el bloque de
+      Ã­ndice ``biti`` en el *pool* ``pool``.
+
+   El parÃ¡metro ``mask`` debe ser una mÃ¡scara de bits que puede estar
+   compuesta por la conjunciÃ³n de los siguientes valores:
+
+   *FINALIZE*:
+      el objeto almacenado en el bloque tiene un destructor (indicador
+      *finals*).
+
+   *NO_SCAN*:
+      el objeto almacenado en el bloque no contiene punteros (indicador
+      *noscan*).
+
+   *NO_MOVE*:
+      el objeto almacenado en el bloque no debe ser movido [#dgcmove]_.
+
+.. [#dgcmove] Si bien el recolector actual no tiene la capacidad de mover
+   objetos, la interfaz del recolector hacer que sea posible una
+   implementaciÃ³n que lo haga, ya que a travÃ©s de este indicador se pueden
+   fijar objetos apuntados desde algÃºn segmento no conservativo (objeto
+   *pinned*).
+
+**BÃºsquedas**
+
+   *findPool(p)*:
+      busca el *pool* al que pertenece el objeto apuntado por ``p``.
+
+   *findBase(p)*:
+      busca la direcciÃ³n base (el inicio) del bloque apuntado por ``p``
+      (``find_block()`` segÃºn la secciÃ³n :ref:`dgc_algo_mark`).
+
+   *findSize(p)*:
+      busca el tamaÃ±o del bloque apuntado por ``p``.
+
+   *getInfo(p)*:
+      obtiene informaciÃ³n sobre el bloque apuntado por ``p``. Dicha
+      informaciÃ³n se retorna en una estructura ``BlkInfo`` que contiene los
+      siguientes atributos: ``base`` (direcciÃ³n del inicio del bloque),
+      ``size`` (tamaÃ±o del bloque) y ``attr`` (atributos o indicadores del
+      bloque, los que se pueden obtener con ``getBits()``).
+
+   *findBin(size)*:
+      calcula el tamaÃ±o de bloque mÃ¡s pequeÃ±o que pueda contener un objeto de
+      tamaÃ±o ``size`` (``find_block_size()`` segÃºn lo visto en
+      :ref:`dgc_algo_alloc`).
+
+**AsignaciÃ³n de memoria**
+
+   Recordar que la ``pooltable`` siempre se mantiene ordenada segÃºn la
+   direcciÃ³n de la primera pÃ¡gina.
+
+   *reserve(size)*:
+      reserva un nuevo *pool* de al menos ``size`` bytes. El algoritmo nunca
+      crea un *pool* con menos de 256 pÃ¡ginas (es decir, 1 MiB).
+
+   *minimize()*:
+      minimiza el uso de la memoria retornando *pools* sin pÃ¡ginas usadas al
+      sistema operativo.
+
+   *newPool(n)*:
+      reserva un nuevo *pool* con al menos ``n`` pÃ¡ginas. Junto con
+      ``Pool.initialize()`` es anÃ¡loga a ``new_pool()``, solo que esta funciÃ³n
+      siempre incrementa el nÃºmero de pÃ¡ginas a, al menos, 256 pÃ¡ginas (es
+      decir, los *pools* son siempre mayores a 1 MiB). Si la cantidad de
+      pÃ¡ginas pedidas supera 256, se incrementa el nÃºmero de pÃ¡ginas en un 50%
+      como para que sirva para futuras asignaciones tambiÃ©n. AdemÃ¡s a medida
+      que la cantidad de *pools* crece, tambiÃ©n trata de obtener cada vez mÃ¡s
+      memoria. Si ya habÃ­a un *pool*, el 2do tendrÃ¡ como mÃ­nimo 2 MiB, el 3ro
+      3 MiB y asÃ­ sucesivamente hasta 8 MiB. A partir de ahÃ­ siempre crea
+      *pools* de 8 MiB o la cantidad pedida, si Ã©sta es mayor.
+
+   *Pool.initialize(n_pages)*:
+      inicializa un nuevo *pool* de memoria. Junto con ``newPool()`` es
+      anÃ¡loga a ``new_pool()``. Mientras ``newPool()`` es la encargada de
+      calcular la cantidad de pÃ¡ginas y crear el objeto *pool*, esta funciÃ³n
+      es la que pide la memoria al sistema operativo. AdemÃ¡s inicializa los
+      conjuntos de bits: ``mark``, ``scan``, ``freebits``, ``noscan``.
+      ``finals`` se inicializa de forma perezosa, cuando se intenta asignar el
+      atributo ``FINALIZE`` a un bloque, se inicializa el conjunto de bits
+      ``finals`` de todo el *pool*.
+
+   *allocPage(bin)*:
+      asigna a una pÃ¡gina libre el tamaÃ±o de bloque ``bin`` y enlaza los
+      nuevos bloques libres a la lista de libres correspondiente (anÃ¡logo
+      a ``assign_page()``).
+
+   *allocPages(n)*:
+      Busca ``n`` cantidad de pÃ¡ginas consecutivas libres (anÃ¡loga
+      a ``find_pages(n)``).
+
+   *malloc(size, bits)*:
+      asigna memoria para un objeto de tamaÃ±o ``size`` bytes. AnÃ¡loga al
+      algoritmo ``new(size, attr)`` presentado, excepto que introduce ademÃ¡s
+      un cachÃ© para no recalcular el tamaÃ±o de bloque necesario si se realizan
+      mÃºltiples asignaciones consecutivas de objetos del mismo tamaÃ±o y que la
+      asignaciÃ³n de objetos pequeÃ±os no estÃ¡ separada en una funciÃ³n aparte.
+
+   *bigAlloc(size)*:
+      asigna un objeto grande (anÃ¡logo a ``new_big()``). La implementaciÃ³n es
+      mucho mÃ¡s compleja que la presentada en ``new_big()``, pero la semÃ¡ntica
+      es la misma. La Ãºnica diferencia es que esta funciÃ³n aprovecha que
+      ``fullcollectshell()`` / ``fullcollect()`` retornan la cantidad de
+      pÃ¡ginas liberadas en la recolecciÃ³n por lo que puede optimizar levemente
+      el caso en que no se liberaron suficientes pÃ¡ginas para asignar el
+      objeto grande y pasar directamente a crear un nuevo *pool*.
+
+   *free(p)*:
+      libera la memoria apuntada por ``p`` (anÃ¡loga a ``delete()`` de la
+      secciÃ³n anterior).
+
+**RecolecciÃ³n**
+
+   *mark(pbot, ptop)*:
+      marca un rango de memoria. Este mÃ©todo es anÃ¡logo al ``mark()``
+      presentado en la secciÃ³n :ref:`dgc_algo_mark` pero marca un rango
+      completo de memoria, lo que permite que sea considerablemente mÃ¡s
+      eficiente.
+
+   *fullcollectshell()*:
+      guarda los registros en el *stack* y llama a ``fullcollect()``. El
+      algoritmo presentado en :ref:`dgc_algo_mark` es simbÃ³lico, ya que si los
+      registros se apilaran en el *stack* dentro de otra funciÃ³n, al salir de
+      esta se volverÃ­an a desapilar, por lo tanto debe ser hecho en la misma
+      funciÃ³n ``collect()`` o en una funciÃ³n que luego la llame (como en este
+      caso).
+
+   *fullcollect(stackTop)*:
+      realiza la recolecciÃ³n de basura. Es anÃ¡loga a ``collect()`` pero
+      considerablemente menos modularizada, todos los pasos se hacen
+      directamente en esta funciÃ³n: marcado del *root set*, marcado iterativo
+      del *heap*, barrido y reconstrucciÃ³n de la lista de libres. AdemÃ¡s
+      devuelve la cantidad de pÃ¡ginas que se liberaron en la recolecciÃ³n, lo
+      que permite optimizar levemente la funciÃ³n ``bigAlloc()``.
 
-Es difÃ­cil que D_ pueda ser un lenguaje de programaciÃ³n exitoso si no provee un
-recolector de basura eficiente y que realmente evite la pÃ©rdida masiva de
-memoria. Por otro lado, D_ podrÃ­a atraer a una base de usuarios mucho mÃ¡s
-amplia, si la gama de estrategias de recolecciÃ³n es mÃ¡s amplia, pudiendo lograr
-adaptarse a mÃ¡s casos de uso sin llegar al lÃ­mite de tener que caer en el
-manejo explÃ­cito de memoria y perder por completo las ventajas de la
-recolecciÃ³n de basura (con la consecuencia ya mencionada de que el manejo de
-memoria tenga que pasar a ser parte de las interfaces y la complejidad que esto
-agrega al diseÃ±o -y uso- de una biblioteca).
 
+FinalizaciÃ³n
+^^^^^^^^^^^^
+El recolector actual, por omisiÃ³n, solamente efectÃºa una recolecciÃ³n al
+finalizar. Por lo tanto, no se ejecutan los destructores de todos aquellos
+objetos que son alcanzables desde el *root set* en ese momento. Existe la
+opciÃ³n de no realizar una recolecciÃ³n al finalizar el recolector, pero no de
+finalizar *todos* los objetos (alcanzables o no desde el *root set*). Si bien
+la especificaciÃ³n de D_ permite este comportamiento (de hecho la
+especificaciÃ³n de D_ es tan vaga que permite un recolector que no llame jamÃ¡s
+a ningÃºn destructor), para el usuario puede ser una garantÃ­a muy dÃ©bil
+y proveer finalizaciÃ³n asegurada puede ser muy deseable.
+
+
+Memoria *encomendada*
+^^^^^^^^^^^^^^^^^^^^^
+El algoritmo actual divide un *pool* en dos Ã¡reas: memoria *encomendada*
+(*committed* en inglÃ©s) y *no-encomentada*. Esto se debe a que originalmente
+el compilador de D_ DMD_ solo funcionaba en Microsoft Windows y este sistema
+operativo puede asignar memoria en dos niveles. Por un lado puede asignar al
+proceso un espacio de memoria (*address space*) pero sin asignarle la memoria
+correspondiente. En un paso posterior se puede *encomendar* la memoria (es
+decir, asignar realmente la memoria).
+
+Para aprovechar esta caracterÃ­stica el recolector diferencia estos dos
+niveles. Sin embargo, esta diferenciaciÃ³n introduce una gran complejidad (que
+se omitiÃ³ en las secciones anteriores para facilitar la comprensiÃ³n),
+y convierte lo que es una ventaja en un sistema operativo en una desventaja
+para todos los demÃ¡s (ya que los cÃ¡lculos extra se realizan pero sin ningÃºn
+sentido). De hecho hay sistemas operativos, como Linux_, que realizan este
+trabajo automÃ¡ticamente (la memoria no es asignada realmente al programa hasta
+que el programa no haga uso de ella; esta capacidad se denomina *overcommit*).
+
+Como se vio en la figura :vref:`fig:dgc-pool`, lÃ¡s pÃ¡ginas de un *pool* se
+dividen en *committed* y *uncommitted*. Siempre que el recolector recorre un
+*pool* en busca de una pÃ¡gina o bloque, lo hace hasta la memoria *committed*,
+porque la *uncommitted* es como si jamÃ¡s se hubiera pedido al sistema
+operativo a efectos prÃ¡cticos. AdemÃ¡s, al buscar pÃ¡ginas libres, si no se
+encuentran entre las *encomendadas* se intenta primero *encomendar* pÃ¡ginas
+nuevas antes de crear un nuevo *pool*.
+
+
+SincronizaciÃ³n
+^^^^^^^^^^^^^^
+Si bien el recolector no es paralelo ni concurrente (ver :ref:`gc_art`),
+soporta mÃºltiples *mutator*\ s. La forma de implementarlo es la mÃ¡s simple.
+Todas las operaciones sobre el recolector que se llaman externamente estÃ¡n
+sincronizadas utilizando un *lock* global (excepto cuando hay un solo hilo
+*mutator*, en cuyo caso se omite la sincronizaciÃ³n). Esto afecta tambiÃ©n a la
+asignaciÃ³n de memoria.
+
+
+
+.. _dgc_good:
+
+CaracterÃ­sticas destacadas
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
+Si bien el recolector en tÃ©rminos generales no se aleja mucho de un
+:ref:`marcado y barrido clÃ¡sico <gc_mark_sweep>`, tiene algunas mejoras por
+sobre el algoritmo mÃ¡s bÃ¡sicos que vale la pena destacar:
 
-Soluciones Propuestas
 
-Para poder implementar un recolector de basura no conservativo es necesario
-disponer de un soporte de reflexiÃ³n (en tiempo de compilaciÃ³n [DNG44607]_ y de
-ejecuciÃ³n [DNG29291]_) bastante completo . De otra forma es imposible
-distinguir si un Ã¡rea de memoria de la pila es utilizada como un puntero o como
-un simple conjunto de datos. D_ provee algÃºn grado de reflexiÃ³n, pero muy
-limitado como para poder obtener este tipo de informaciÃ³n. Ya hay un plan para
-agregar mayores capacidades de reflexibilidad [DNG6842]_, y un pequeÃ±o avance
-en este sentido en la `versiÃ³n 1.001`_, pero con algunos problemas [DNG6890]_
-[DNG6893]_.
+OrganizaciÃ³n del *heap*
+^^^^^^^^^^^^^^^^^^^^^^^
+El *heap* estÃ¡ organizado de una forma que, si bien no emplea las tÃ©cnicas mÃ¡s
+modernas que pueden observarse en el estado del arte (como :ref:`regiones
+<gc_free_list>`), es relativamente sofisticada. El esquema de *pools*
+y bloques permite disminuir considerablemente los problemas de *fragmentaciÃ³n*
+de memoria y evita bÃºsquedas de *huecos* que pueden ser costosas (como
+*best-fit* [#dgcbestfit]_) o desperdiciar mucho especio (como *first-fit*
+[#dgcfirstfit]_), logrando un buen equilibrio entre velocidad y espacio
+desperdiciado.
+
+.. [#dgcbestfit] Las bÃºsquedas de tipo *best-fit* son aquellas donde se busca
+   el *hueco* en el *heap* (es decir, una regiÃ³n contÃ­nua de memoria
+   libre) que mejor se ajuste al tamaÃ±o del objeto a asignar. Es decir, el
+   *hueco* mÃ¡s pequeÃ±o lo suficientemente grande como para almacenarlo.
+
+.. [#dgcfirstfit] Las bÃºsquedas de tipo *first-fit* son aquellas donde se busca
+   el primer *hueco* en el *heap* (es decir, una regiÃ³n contÃ­nua de memoria
+   libre) que sea lo suficientemente grande como para almacenar el objeto
+   a asignar.
+
+
+Fase de marcado iterativa
+^^^^^^^^^^^^^^^^^^^^^^^^^
+A diferencia del algoritmo clÃ¡sico recursivo, el algoritmo del recolector
+actual es iterativo. El algoritmo recursivo tiene un problema fundamental: se
+puede llegar a un desbordamiento de pila (o *stack overflow*). La cantidad de
+recursiones necesarias es, en el peor caso, :math:`O(|Live \thickspace set|)`
+(por ejemplo, si todas las celdas del *heap* formaran una lista simplemente
+enlazada). Hay muchas tÃ©cnicas para lidiar con este problema, algunas que
+podrÃ­an aplicarse a D_ y otras que no (como *pointer reversal*) [JOLI96]_. El
+recolector actual, sin embargo, cambia complejidad en espacio por complejidad
+en tiempo, utilizando un algoritmo iterativo que es constante (:math:`O(1)`)
+en espacio, pero que requiere varias pasada sobre el *heap* en vez de una (la
+cantidad de pasadas es en el peor caso, al igual que la cantidad de
+recursiones del algoritmo recursivo, :math:`O(|Live \thickspace set|)`, pero
+cada pasada se realiza por sobre todo el *heap*).
+
+
+Conjuntos de bits para indicadores
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+El algoritmo clÃ¡scio propone almacenar en la propia celda la marca (para la
+fase de marcado) y otros indicadores. El algoritmo del recolector actual
+utiliza conjuntos de bits. Esto trae dos ventajas principales:
+
+* Permite minimizar el espacio requerido, ya que de otra forma en general se
+  desperdicia una palabra entera como cabecera de celda para guardar este tipo
+  de informaciÃ³n.
+
+* Mejora la localidad de referencia, ya que los indicadores se escriben de
+  forma muy compacta y en una regiÃ³n de memoria contÃ­gua que generalmente
+  puede entrar en el cache o en pocas pÃ¡ginas de memoria acelerando
+  considerablemente la fase de marcado.
+
+
+
+.. _dgc_bad:
+
+Problemas y limitaciones
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
-.. _`versiÃ³n 1.001`: http://www.digitalmars.com/d/changelog.html#new1_001
+A continuaciÃ³n se presentan los principales problemas encontrados en la
+implementaciÃ³n actual del recolector de basura de D_. Estos problemas surgen
+principalmente de la observaciÃ³n del cÃ³digo y de aproximadamente 3 aÃ±os de
+participaciÃ³n y observaciÃ³n del grupo de noticias, de donde se obtuvieron los
+principales problemas percibidos por la comunidad que utiliza el lenguaje.
+
+
+Complejidad del cÃ³digo y documentaciÃ³n
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+El anÃ¡lisis del cÃ³digo fue muy complicado debido a la falta de documentaciÃ³n
+y desorganizaciÃ³n del cÃ³digo. AdemÃ¡s se nota que el recolector ha sido escrito
+en una fase muy temprana y que a ido evolucionando a partir de ello de forma
+desprolija y sin ser rescrito nunca para aprovechar las nuevas caracterÃ­sticas
+que el lenguaje fue incorporando (por ejemplo *templates*).
+
+Estos dos problemas (cÃ³digo complicado y falta de documentaciÃ³n) producen un
+efecto de cÃ­rculo vicioso, porque provocan que sea complejo entender el
+recolector actual y en consecuencia sea muy complicado escribir documentaciÃ³n
+o mejorarlo. Esto a su vez provoca que, al no disponer de una implementaciÃ³n
+de referencia sencilla, sea muy difÃ­cil implementar un recolector nuevo.
+
+Este es, probablemente, la raÃ­z de todos los demÃ¡s problemas del recolector
+actual. Para ilustrar la dimensiÃ³n del problema se presenta la implementaciÃ³n
+real de la funciÃ³n ``bigAlloc()``::
+
+    /**
+     * Allocate a chunk of memory that is larger than a page.
+     * Return null if out of memory.
+     */
+    void *bigAlloc(size_t size)
+    {
+        Pool*  pool;
+        size_t npages;
+        size_t n;
+        size_t pn;
+        size_t freedpages;
+        void*  p;
+        int    state;
+
+        npages = (size + PAGESIZE - 1) / PAGESIZE;
+
+        for (state = 0; ; )
+        {
+            // This code could use some refinement when repeatedly
+            // allocating very large arrays.
+
+            for (n = 0; n < npools; n++)
+            {
+                pool = pooltable[n];
+                pn = pool.allocPages(npages);
+                if (pn != OPFAIL)
+                    goto L1;
+            }
+
+            // Failed
+            switch (state)
+            {
+            case 0:
+                if (disabled)
+                {   state = 1;
+                    continue;
+                }
+                // Try collecting
+                freedpages = fullcollectshell();
+                if (freedpages >= npools * ((POOLSIZE / PAGESIZE) / 4))
+                {   state = 1;
+                    continue;
+                }
+                // Release empty pools to prevent bloat
+                minimize();
+                // Allocate new pool
+                pool = newPool(npages);
+                if (!pool)
+                {   state = 2;
+                    continue;
+                }
+                pn = pool.allocPages(npages);
+                assert(pn != OPFAIL);
+                goto L1;
+            case 1:
+                // Release empty pools to prevent bloat
+                minimize();
+                // Allocate new pool
+                pool = newPool(npages);
+                if (!pool)
+                    goto Lnomemory;
+                pn = pool.allocPages(npages);
+                assert(pn != OPFAIL);
+                goto L1;
+            case 2:
+                goto Lnomemory;
+            default:
+                assert(false);
+            }
+        }
+
+      L1:
+        pool.pagetable[pn] = B_PAGE;
+        if (npages > 1)
+            cstring.memset(&pool.pagetable[pn + 1], B_PAGEPLUS, npages - 1);
+        p = pool.baseAddr + pn * PAGESIZE;
+        cstring.memset(cast(char *)p + size, 0, npages * PAGESIZE - size);
+        debug (MEMSTOMP) cstring.memset(p, 0xF1, size);
+        //debug(PRINTF) printf("\tp = %x\n", p);
+        return p;
+
+      Lnomemory:
+        return null; // let mallocNoSync handle the error
+    }
+
+Se recuerda que la semÃ¡ntica de dicha funciÃ³n es la misma que la de la funciÃ³n
+``new_big()`` presentada en :ref:`dgc_algo_alloc`.
+
+AdemÃ¡s, como se comentÃ³ en la secciÃ³n anterior, los algoritmos en la
+implementaciÃ³n real estÃ¡n considerablemente menos modularizados que los
+presentados en la secciÃ³n :ref:`dgc_algo`. Por ejemplo, la funciÃ³n
+``fullcollect()`` son 300 lÃ­neas de cÃ³digo.
+
+
+Memoria *encomendada*
+^^^^^^^^^^^^^^^^^^^^^
+Como se comentÃ³ en la secciÃ³n anterior, diferenciar entre memoria
+*encomendada* de memoria *no-encomendada* es complejo y levemente costoso (en
+particular para sistemas operativos que no hacen esta distinciÃ³n, al menos
+explÃ­citamente, donde no hay ningÃºn beneficio en realizar esta distinciÃ³n).
+
+Incluso para Microsoft Windows, la ventaja de realizar esta distinciÃ³n es
+discutible.
+
+
+PrecisiÃ³n
+^^^^^^^^^
+Este fue historicamente uno de los problemas principales del recolector de D_
+[NGD46407]_ [NGD35364]_. Sin embargo, desde que, en la versiÃ³n 1.001, se ha
+incorporado la capacidad de marcar un bloque como de datos puros (no contiene
+punteros, el atributo ``NO_SCAN``) [NGA6842]_, la gravedad de esos problemas ha
+disminuÃ­do considerablemente, aunque siguieron reportÃ¡ndose problemas mÃ¡s
+esporÃ¡dicamente [NGD54084]_ [NGL13744]_.
+
+De todas maneras queda mucho lugar para mejoras, y es un tema recurrente en el
+grupo de noticias de D_ y se han discutido formas de poder hacer que, al menos
+el *heap* sea preciso [NGD44607]_ [NGD29291]_. AdemÃ¡s se mostro un interÃ©s
+general por tener un recolector mÃ¡s preciso [NGDN87831]_, pero no han habido
+avances al respecto.
+
+Otra forma de minimizar los efectos de la falta de precisiÃ³n que se ha
+sugerido reiteradamente en el grupo es teniendo la
+posibilidad de indicar cuando no pueden haber punteros interiores a un bloque
+[NGD89394]_ [NGD71869]_. Esto puede ser de gran utilidad para objetos grandes
+y en particular para mejorar la implementaciÃ³n de de arreglos asociativos.
+
+
+Referencias dÃ©biles
+^^^^^^^^^^^^^^^^^^^
+El recolector actual no dispone de soporte de *referencias dÃ©biles*
+[#dgcweakref]_, sin embargo hay una demanda [NGD86840]_ [NGD13301]_ [NGL8264]_
+[NGD69761]_ [NGD74624]_ [NGD88065]_
 
-Se han propuesto otros mÃ©todos e implementaciones de recolector de basura, por
-ejemplo colectores con movimiento (*moving collectors*) [DNG42557]_ y conteo de
-referencias [DNG38689]_. Pero D_ es un lenguaje muy particular en cuanto a la
-recolecciÃ³n de basura (al permitir :ref:d_low_level hay muchas consideraciones
-a las que otros lenguajes no deben enfrentarse) y no es sencillo pensar en
-otras implementaciones sin hacer modificaciones de base al lenguaje.
+.. [#dgcweakref] Una referencia dÃ©bil (o *weak reference* en inglÃ©s) es
+   aquella que que no protege al objeto referenciado de ser reciclado por el
+   recolector.
 
+Para cubrir esta demanda, se han implementado soluciones como biblioteca para
+suplir la inexistencia de una implementaciÃ³n oficial [NGA9103]_.
 
+Sin embargo Ã©stas son en general poco robustas y extremadamente dependientes
+de la implementaciÃ³n del recolector y, en general, presentan problemas muy
+sutiles [NGD88065]_. Por esta razÃ³n se ha discutido la posibilidad de incluir
+la implementaciÃ³n de *referencias dÃ©biles* como parte del lenguaje
+[NGD88559]_.
 
-Problemas para Implementar Colectores con Movimiento
 
-El principal problema es la capacidad de D_ de manipular punteros y otras
-estructuras de bajo nivel, como uniones. O incluso la capacidad de interactuar
-con C. Al mover un objeto de un Ã¡rea de memoria a otro, es necesario actualizar
-todos los punteros que apuntan a Ã©ste. En D_ esta tarea no es trivial
-[DNG42564]_
+Concurrencia
+^^^^^^^^^^^^
+El soporte actual de concurrencia, en todos sus aspectos, es muy primitivo. El
+recolector apenas soporta mÃºltiples *mutators* pero con un nivel de
+sincronizaciÃ³n excesivo.
 
+Se ha sugerido en el pasado el uso de *pools* y listas de libres especÃ­ficos
+de hilos, de manera de disminuir la contenciÃ³n, al menos para la asignaciÃ³n de
+memoria [NGD75952]_ [NGDN87831]_.
 
+AdemÃ¡s se ha mostrado un interÃ©s por tener un nivel de concurrencia aÃºn mayor
+en el recolector, para aumentar la concurrencia en ambientes *multi-core* en
+general pero en particular para evitar grandes pausas en programas con
+requerimientos de tiempo real, historicamente una de las principales crÃ­ticas
+al lenguaje [NGDN87831]_ [NGL3937]_ [NGD22968]_ [NGA15246]_ [NGD5622]_
+[NGD2547]_ [NGD18354]_.
 
-Problemas para Implementar Conteo de Referencias
 
-Este tipo de recolectores reparten la carga de la recolecciÃ³n de forma uniforme
-a lo largo (y a la par) de la ejecuciÃ³n del programa. El problema principal
-para implementar este tipo de recolecciÃ³n es la necesidad de soporte en el
-compilador (cada asignaciÃ³n debe ser acompaÃ±ada por el incremento/decremento de
-contadores de referencia), a menos que se implemente en una biblioteca. Por
-otro lado, caracterÃ­sticas como el rebanado de arreglos (ver :ref:d_high_level)
-son difÃ­ciles de proveer con el conteo de referencias, entre otros problemas
-[DNG38704]_.
+FinalizaciÃ³n
+^^^^^^^^^^^^
+El recolector actual no garantiza la finalizaciÃ³n de objetos. En particular
+los objetos no son finalizados (es decir, no se llama a sus destructores)
+si aÃºn alcanzables desde el *root set* cuando el programa termina. Cabe
+destacar que esto puede darse porque hay una referencia real desde el *root
+set* (en cuyo caso queda bajo el control del usuario) pero tambiÃ©n, dado que
+el *root set* se visita de forma conservativa, se puede deber a un falso
+positivo, en cuyo caso la omisiÃ³n de la finalizaciÃ³n queda por completo fuera
+del control del usuario (y lo que es aÃºn peor, el usuario no puede ser
+siquiera notificado de esta anomalÃ­a).
+
+Si bien la especificaciÃ³n de D_ no requiere esta capacidad (de hecho,
+rigurosamente hablando la especificaciÃ³n de D_ no garantiza la finalizaciÃ³n de
+objetos bajo ninguna circunstancia), no hay mayores problemas para implementar
+un recolector que de este tipo de garantÃ­as [NGD88298]_.
+
+AdemÃ¡s los objetos pueden ser finalizados tanto determinÃ­sticamente
+(utilizando ``delete`` o ``scope``; ver secciones :ref:`d_low_level`
+y :ref:`d_dbc`) como no deterministicamente (cuando son finalizados por el
+recolector). En el primer caso se puede, por ejemplo, acceder sus atributos
+u otra memoria que se conozca *viva*, mientras que en el segundo no. Sin
+embargo un destructor no puede hacer uso de esta distinciÃ³n, haciendo que la
+finalizaciÃ³n determinÃ­stica tenga a fines prÃ¡cticos las mismas restricciones
+que la finalizaciÃ³n no deterministica. Es por esto que se ha sugerido permitir
+al destructor distinguir estos dos tipos de finalizaciÃ³n [NGD89302]_.
+
+
+Eficiencia
+^^^^^^^^^^
+La eficiencia en general del recolector es una de las crÃ­ticas frecuentes. Si
+bien hay muchos problemas que han sido resueltos, en especial por la inclusiÃ³n
+de un mÃ­nimo grado de precisiÃ³n en la versiÃ³n 1.001, en la actualidad se
+siguen encontrando en el grupo de noticias crÃ­ticas respecto a esto
+[NGD43991]_ [NGD67673]_ [NGD63541]_ [NGD90977]_.
+
+La principal causa de la ineficiencia del recolector actual es, probablemente,
+lo simple de su algoritmo principal de recolecciÃ³n. MÃ¡s allÃ¡ de una
+organizaciÃ³n del *heap* moderadamente apropiada y de utilizar conjuntos de
+bits para la fase de marcado, el resto del algoritmo es casi la versiÃ³n mÃ¡s
+bÃ¡sica de marcado y barrido. Hay mucho lugar para mejoras en este sentido.
+
+
+Detalles
+^^^^^^^^
+Finalmente hay varios detalles en la implementaciÃ³n actual que podrÃ­an
+mejorarse:
+
+Listas de libres:
+  hay 12 listas de libres, como para guardar bloques de tamaÃ±o de ``B_16``
+  a ``B_2048``, ``B_PAGE``, ``B_PAGEPLUS``, ``B_UNCOMMITTED`` y ``B_FREE``;
+  sin embargo solo tienen sentido los bloques de tamaÃ±o ``B_16`` a ``B_2048``,
+  por lo que 4 de esas listas no se utilizan.
+
+Conjuntos de bits para indicadores:
+  los indicadores para la fase de marcado y otras propiedades de un bloque son
+  almacenados en conjuntos de bits que almacenan los indicadores de todos los
+  bloques de un *pool*. Si bien se ha mencionado esto como una ventaja, hay
+  lugar todavÃ­a como para algunas mejoras. Como un *pool* tiene pÃ¡ginas con
+  distintos tamaÃ±os de bloque, se reserva una cantidad de bits igual a la
+  mayor cantidad posible de bloques que puede haber en el *pool*; es decir, se
+  reserva 1 bit por cada 16 bytes del *pool*. Para un *pool* de 1 MiB (tamaÃ±o
+  mÃ­nimo), teniendo en cuenta que se utilizan 5 conjuntos de bits (``mark``,
+  ``scan``, ``finals``, ``freebits`` y ``noscan``), se utilizan 40 KiB de
+  memoria para conjuntos de bits (un 4% de *desperdicio* si, por ejemplo, ese
+  *pool* estuviera destinado por completo a albergar un solo objeto grande; lo
+  que equivaldrÃ­a al 2560 objetos de 16 bytes desperdiciados en bits
+  inutilizados).
+
+RepeticiÃ³n de cÃ³digo:
+   Hay algunos fragmentos de cÃ³digo repetidos inecesariamente. Por ejemplo en
+   varios lugares se utilizan arreglos de tamaÃ±o variable que se implementan
+   repetidas veces (en general como un puntero al inicio del arreglo mÃ¡s el
+   tamaÃ±o actual del arreglo mÃ¡s el tamaÃ±o de la memoria total asignada
+   actualmente). Esto es propenso a errores y difÃ­cil de mantener.
+
+Uso de seÃ±ales:
+   el recolector actual utiliza las seÃ±ales del sistema operativo ``SIGUSR1``
+   y ``SIGUSR2`` para pausar y reanudar los hilos respectivamente. Esto
+   puede traer incovenientes a usuarios que desean utilizar estas
+   seÃ±ales en sus programas (o peor aÃºn, si interactÃºan con bibliotecas
+   de C que hacen uso de estas seÃ±ales) [NGD5821]_.
+
+Marcado iterativo:
+   si bien esto se mencionÃ³ como algo bueno del recolector actual, es un
+   compromiso entre tiempo y espacio, y puede ser interesante analizar otros
+   mÃ©todos para evitar la recursiÃ³n que no requieran tantas pasadas sobre el
+   *heap*.
 
 
 .. include:: links.rst