X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/9807a6191b2fbf16cd9c05766a410b9844a372f3..6c0df59:/source/dgc.rst?ds=sidebyside

diff --git a/source/dgc.rst b/source/dgc.rst
index b5460a8..f087aef 100644
--- a/source/dgc.rst
+++ b/source/dgc.rst
@@ -4,7 +4,7 @@
    de recolecciÃ³n de basura en dicho lenguaje (se explica por quÃ© las
    particularidades descriptas en la secciÃ³n anterior complican la
    recolecciÃ³n de basura y cuales son las que mÃ¡s molestan).
-   ESTADO: TERMINADO, CORREGIDO
+   ESTADO: TERMINADO
 
 
 .. _dgc:
@@ -49,7 +49,7 @@ Sin dudas las caracterÃ­sticas de D_ que lo hacen mÃ¡s complejo a la hora de
 implementar un recolector de basura son sus capacidades de programaciÃ³n de
 bajo nivel (ver :ref:`d_low_level`).
 
-Al proveer acceso a *aasembly*, permitir estructuras de tipo *union* y ser
+Al proveer acceso a *assembly*, permitir estructuras de tipo *union* y ser
 compatible con C/C++, el recolector de basura tiene muchas restricciones. Por
 ejemplo debe tratar de forma conservativa los registros y el *stack*, ya que
 es la Ãºnica forma de interactuar de forma segura con C/C++ y *assembly*.
@@ -337,11 +337,11 @@ Atributos de *pool*
 ^^^^^^^^^^^^^^^^^^^
 Cada *pool* tiene la siguiente informaciÃ³n asociada:
 
-*number_of_pages*:
+*number_of_pages*
    cantidad de pÃ¡ginas que tiene. Esta cantidad es fija en toda la vida de un
    *pool*.
 
-*pages*:
+*pages*
    bloque de memoria contiguo de tamaÃ±o ``PAGE_SIZE * number_of_pages``
    (siendo ``PAGE_SIZE`` el tamaÃ±o de pÃ¡gina, que normalmente son 4096 bytes).
 
@@ -356,13 +356,13 @@ Una pÃ¡gina siempre almacena bloques del mismo tamaÃ±o, que pueden ser 16, 32,
 ``PAGE``). AdemÃ¡s hay dos tamaÃ±os de bloque simbÃ³licos que tienen un
 significado especial:
 
-``FREE``:
+``FREE``
    indica que la pÃ¡gina estÃ¡ completamente libre y que la pÃ¡gina estÃ¡
    disponible para albergar cualquier tamaÃ±o de bloque que sea necesario (pero
    una vez que se le asignÃ³ un nuevo tamaÃ±o de bloque ya no puede ser cambiado
    hasta que la pÃ¡gina vuelva a liberarse por completo).
 
-``CONTINUATION``:
+``CONTINUATION``
    indica que esta pÃ¡gina es la continuaciÃ³n de un objeto grande (es decir,
    que ocupa una o mÃ¡s pÃ¡ginas). Luego se presentan mÃ¡s detalles sobre objetos
    grandes.
@@ -375,28 +375,28 @@ Atributos de bloque
 ^^^^^^^^^^^^^^^^^^^
 Cada bloque tiene asociados varios atributos:
 
-*mark*:
+*mark*
    utilizado en la fase de :ref:`marcado <dgc_algo_mark>`, indica que un nodo
    ya fue visitado (serÃ­an las celdas *negras* en la :ref:`abstracciÃ³n
    tricolor <gc_intro_tricolor>`).
 
-*scan*:
+*scan*
    utilizado tambiÃ©n en la fase de :ref:`marcado <dgc_algo_mark>`, indica que
    una celda visitada todavÃ­a tiene *hijas* sin marcar (serÃ­an las celdas
    *grises* en la :ref:`abstracciÃ³n tricolor <gc_intro_tricolor>`).
 
-*free*:
+*free*
    indica que el bloque estÃ¡ libre (no estÃ¡ siendo utilizado por ningÃºn objeto
    *vivo*). Esto es necesario solo por la forma en la que realiza el
    :ref:`marcado <dgc_algo_mark>` y :ref:`barrido <dgc_algo_sweep>` en el
    :ref:`algoritmo actual <dgc_algo>` (las celdas con el atributo este
    atributo son tomadas como *basura* aunque estÃ©n marcadas con *mark*).
 
-*final*:
+*final*
    indica que el bloque contiene un objeto que tiene un destructor (que debe
    ser llamado cuando la celda pasa de *viva* a *basura*).
 
-*noscan*:
+*noscan*
    indica que el bloque contiene un objeto que no tiene punteros y por lo
    tanto no debe ser marcado de forma conservativa (no tiene *hijas*).
 
@@ -455,31 +455,42 @@ Esta fase consiste de varios pasos, que pueden resumirse en el siguiente
 algoritmo::
 
    function mark_phase() is
-      more_to_scan = false
+      global more_to_scan = false
       stop_the_world()
       clear_mark_scan_bits()
       mark_free_lists()
       mark_static_data()
       push_registers_into_stack()
+      thread_self.stack.end = get_stack_top()
       mark_stacks()
+      pop_registers_from_stack()
       mark_user_roots()
       mark_heap()
       start_the_world()
 
 La variable **global** ``more_to_scan`` indica al algoritmo iterativo cuando
-debe finalizar: la funciÃ³n ``mark()`` (que veremos mÃ¡s adelante) lo pone en
-``true`` cuando una nueva celda debe ser visitada, por lo tanto la iteraciÃ³n
-se interrumpe cuando no hay mÃ¡s celdas por visitar.
+debe finalizar: la funciÃ³n ``mark_range()`` (que veremos mÃ¡s adelante) lo pone
+en ``true`` cuando una nueva celda debe ser visitada, por lo tanto la
+iteraciÃ³n se interrumpe cuando no hay mÃ¡s celdas por visitar.
 
-Las funciones ``stop_the_world()`` y ``start_the_world()`` sencillamente
-pausan y reanudan todos los hilos respectivamente::
+Las funciones ``stop_the_world()`` y ``start_the_world()`` pausan y reanudan
+todos los hilos respectivamente (salvo el actual). Al pausar los hilos ademÃ¡s
+se guardan los registros del procesador en el *stack* y se guarda la posiciÃ³n
+actual del *stack* para que la fase de marcado pueda recorrerlos::
 
    function stop_the_world() is
       foreach thread in threads
+         if thread is thread_self
+            continue
          thread.pause()
+         push_registers_into_stack()
+         thread.stack.end = get_stack_top()
 
    function start_the_world() is
       foreach thread in threads
+         if thread is thread_self
+            continue
+         pop_registers_from_stack()
          thread.resume()
 
 La funciÃ³n ``clear_mark_scan_bits()`` se encarga de restablecer todos los
@@ -517,9 +528,7 @@ Primero se marca el Ã¡rea de memoria estÃ¡tica de manera :ref:`conservativa
 <gc_conserv>` (es decir, tomando cada *word* como si fuera un puntero)::
 
    function mark_static_data() is
-      foreach word in static_data
-         pointer = cast(void*) word
-         mark(pointer)
+      mark_range(static_data.begin, static_data.end)
 
 Para poder tomar los registros como parte del *root set* primero se apilan
 en el *stack* a travÃ©s de la funciÃ³n::
@@ -528,14 +537,19 @@ en el *stack* a travÃ©s de la funciÃ³n::
       foreach register in registers
          push(register)
 
+Y luego se descartan (no es necesario ni correcto restablecer los valores ya
+que podrÃ­an tener nuevos valores) al sacarlos de la pila::
+
+   function pop_registers_from_stack() is
+      foreach register in reverse(registers)
+         pop()
+
 Una vez hecho esto, basta marcar (de forma conservativa) los *stacks* de todos
 los threads para terminar de marcar el *root set*::
 
    function mark_stacks() is
       foreach thread in threads
-         foreach word in thread.stack
-            pointer = cast(void*) word
-            mark(pointer)
+         mark_range(thread.stack.begin, thread.stack.end)
 
 Dado que D_ soporta manejo de memoria manual al mismo tiempo que memoria
 automÃ¡tica, es posible que existan celdas de memoria que no estÃ©n en el *root
@@ -546,20 +560,23 @@ estas nuevas raÃ­ces. Es por esto que para concluir el marcado del *root set*
 completo se procede a marcar las raÃ­ces definidas por el usuario::
 
    function mark_user_roots() is
-      foreach pointer in user_roots
-         mark(pointer)
+      foreach root_range in user_roots
+         mark_range(root_range.begin, root_range.end)
 
 El algoritmo de marcado no es recursivo sino iterativo por lo tanto al marcar
 una celda (o bloque) no se siguen sus *hijas*, solo se activa el bit de *scan*
 (a menos que la celda no contenga punteros, es decir, tenga el bit *noscan*)::
 
-   function mark(pointer) is
-      [pool, page, block] = find_block(pointer)
-      if block is not null and block.mark is false
-         block.mark = true
-         if block.noscan is false
-            block.scan = true
-            more_to_scan = true
+   function mark_range(begin, end) is
+      pointer = begin
+      while pointer < end
+         [pool, page, block] = find_block(pointer)
+         if block is not null and block.mark is false
+            block.mark = true
+            if block.noscan is false
+               block.scan = true
+               global more_to_scan = true
+         pointer++
 
 Por lo tanto en este punto, tenemos todas las celdas inmediatamente
 alcanzables desde el *root set* marcadas y con el bit *scan* activado si la
@@ -568,8 +585,8 @@ forma conservativa) iterativamente todo el *heap* hasta que no hayan mÃ¡s
 celdas para visitar (con el bit *scan* activo)::
 
    function mark_heap() is
-      while more_to_scan
-         more_to_scan = false
+      while global more_to_scan
+         global more_to_scan = false
          foreach pool in heap
             foreach page in pool
                if page.block_size <= PAGE // saltea FREE y CONTINUATION
@@ -577,15 +594,11 @@ celdas para visitar (con el bit *scan* activo)::
                      if block.scan is true
                         block.scan = false
                         if page.block_size is PAGE // objeto grande
-                           start = cast(byte*) page
+                           begin = cast(byte*) page
                            end = find_big_object_end(pool, page)
-                           foreach word in start..end
-                                 pointer = cast(void*) word
-                                 mark(pointer)
+                           mark_range(begin, end)
                         else // objeto pequeÃ±o
-                           foreach word in block
-                              pointer = cast(void*) word
-                              mark(pointer)
+                           mark_range(block.begin, block.end)
 
 AquÃ­ puede verse, con un poco de esfuerzo, la utilizaciÃ³n de la
 :ref:`abstracciÃ³n tricolor <gc_intro_tricolor>`: todas las celdas alcanzables
@@ -665,9 +678,9 @@ objetos grandes se marcan todas las pÃ¡ginas que utilizaban como ``FREE``::
    function free_big_object(pool, page) is
       pool_end = cast(byte*) pool.pages + (PAGE_SIZE * pool.number_of_pages)
       do
-         page = cast(byte*) page + PAGE_SIZE
          page.block_size = FREE
-      while page.block_size is CONTINUATION and page < pool_end
+         page = cast(byte*) page + PAGE_SIZE
+      while page < pool_end and page.block_size is CONTINUATION
 
 AdemÃ¡s, los bloques que tienen en atributo ``final`` son finalizados llamando
 a la funciÃ³n ``finalize()``. Esta funciÃ³n es un servicio que provee la
@@ -746,16 +759,15 @@ suficientemente grande como para poder almacenar el tamaÃ±o solicitado). Una
 vez mÃ¡s el algoritmo distingue objetos grandes de pequeÃ±os. Los pequeÃ±os se
 asignan de las siguiente manera::
 
-      function new_small(block_size) is
+   function new_small(block_size) is
+      block = find_block_with_size(block_size)
+      if block is null
+         collect()
          block = find_block_with_size(block_size)
          if block is null
-            collect()
+            new_pool()
             block = find_block_with_size(block_size)
-            if block is null
-               new_pool()
-               block = find_block_with_size(block_size)
-               return null
-         return block
+      return block
 
 Se intenta reiteradas veces conseguir un bloque del tamaÃ±o correcto libre,
 realizando diferentes acciones si no se tiene Ã©xito. Primero se intenta hacer
@@ -765,39 +777,41 @@ pidiendo memoria al *low level allocator* (el sistema operativo generalmente).
 
 Para intentar buscar un bloque de memoria libre se realiza lo siguiente::
 
-      function find_block_with_size(block_size) is
+   function find_block_with_size(block_size) is
+      block = free_lists[block_size].pop_first()
+      if block is null
+         assign_page(block_size)
          block = free_lists[block_size].pop_first()
-         if block is null
-            assign_page(block_size)
-            block = free_lists[block_size].pop_first()
-         return block
+      return block
 
 Si no se puede obtener un bloque de la lista de libres correspondiente, se
 busca asignar una pÃ¡gina libre al tamaÃ±o de bloque deseado de forma de
 *alimentar* la lista de libres con dicho tamaÃ±o::
 
-      function assign_page(block_size) is
-         foreach pool in heap
-            foreach page in pool
-               if page.block_size is FREE
-                  page.block_size = block_size
-                  foreach block in page
-                     free_lists[page.block_size].link(block)
+   function assign_page(block_size) is
+      foreach pool in heap
+         foreach page in pool
+            if page.block_size is FREE
+               page.block_size = block_size
+               foreach block in page
+                  free_lists[page.block_size].link(block)
 
 Cuando todo ello falla, el Ãºltimo recurso consiste en pedir memoria al sistema
 operativo, creando un nuevo *pool*::
 
-      funciones new_pool(number_of_pages = 1) is
-         pool = alloc(pool.sizeof)
-         if pool is null
-            return null
-         pool.number_of_pages = number_of_pages
-         pool.pages = alloc(number_of_pages * PAGE_SIZE)
-         if pool.pages is null
-            free(pool)
-            return null
-         heap.add(pool)
-         return pool
+   function new_pool(number_of_pages = 1) is
+      pool = alloc(pool.sizeof)
+      if pool is null
+         return null
+      pool.number_of_pages = number_of_pages
+      pool.pages = alloc(number_of_pages * PAGE_SIZE)
+      if pool.pages is null
+         free(pool)
+         return null
+      heap.add(pool)
+      foreach page in pool
+         page.block_size = FREE
+      return pool
 
 Se recuerda que la funciÃ³n ``alloc()`` es un :ref:`servicio
 <gc_intro_services>` provisto por el *low level allocator* y en la
@@ -813,22 +827,22 @@ Si el tamaÃ±o de bloque necesario para cumplir con la asignaciÃ³n de memoria es
 de una pÃ¡gina, entonces se utiliza otro algoritmo para alocar un objeto
 grande::
 
-      function new_big(size) is
-         number_of_pages = ceil(size / PAGE_SIZE)
+   function new_big(size) is
+      number_of_pages = ceil(size / PAGE_SIZE)
+      pages = find_pages(number_of_pages)
+      if pages is null
+         collect()
          pages = find_pages(number_of_pages)
          if pages is null
-            collect()
-            pages = find_pages(number_of_pages)
-            if pages is null
-               minimize()
-               pool = new_pool(number_of_pages)
-               if pool is null
-                  return null
-               pages = assign_pages(pool, number_of_pages)
-         pages[0].block_size = PAGE
-         foreach page in pages[1..end]
-            page.block_size = CONTINUATION
-         return pages[0]
+            minimize()
+            pool = new_pool(number_of_pages)
+            if pool is null
+               return null
+            pages = assign_pages(pool, number_of_pages)
+      pages[0].block_size = PAGE
+      foreach page in pages[1..end]
+         page.block_size = CONTINUATION
+      return pages[0]
 
 De forma similar a la asignaciÃ³n de objetos pequeÃ±os, se intenta encontrar una
 serie de pÃ¡ginas contiguas, dentro de un mismo *pool*, suficientes para
@@ -840,9 +854,9 @@ siguiente funciÃ³n, que devuelve al *low level allocator* los *pools*
 completamente libres::
 
    function minimize() is
-      for pool in heap
+      foreach pool in heap
          all_free = true
-         for page in pool
+         foreach page in pool
             if page.block_size is not FREE
                all_free = false
                break
@@ -854,34 +868,34 @@ completamente libres::
 Volviendo a la funciÃ³n ``new_big()``, para hallar una serie de pÃ¡ginas
 contiguas se utiliza el siguiente algoritmo::
 
-      function find_pages(number_of_pages) is
-         foreach pool in heap
-            pages = assign_pages(pool, number_of_pages)
-            if pages
-               return pages
-         return null
+   function find_pages(number_of_pages) is
+      foreach pool in heap
+         pages = assign_pages(pool, number_of_pages)
+         if pages
+            return pages
+      return null
 
 Como se dijo, las pÃ¡ginas deben estar contenidas en un mismo *pool* (para
 tener la garantÃ­a de que sean contiguas), por lo tanto se busca *pool* por
 *pool* dicha cantidad de pÃ¡ginas libres consecutivas a travÃ©s del siguiente
 algoritmo::
 
-      function assign_pages(pool, number_of_pages) is
-         pages_found = 0
-         first_page = null
-         foreach page in pool
-            if page.block_size is FREE
-               if pages_found is 0
-                  pages_found = 1
-                  first_page = page
-               else
-                  pages_found = pages_found + 1
-               if pages_found is number_of_pages
-                  return [first_page .. page]
+   function assign_pages(pool, number_of_pages) is
+      pages_found = 0
+      first_page = null
+      foreach page in pool
+         if page.block_size is FREE
+            if pages_found is 0
+               pages_found = 1
+               first_page = page
             else
-               pages_found = 0
-               first_page = null
-         return null
+               pages_found = pages_found + 1
+            if pages_found is number_of_pages
+               return [first_page .. page]
+         else
+            pages_found = 0
+            first_page = null
+      return null
 
 Una vez mÃ¡s, cuando todo ello falla (incluso luego de una recolecciÃ³n), se
 intenta alocar un nuevo *pool*, esta vez con una cantidad de pÃ¡ginas
@@ -951,22 +965,20 @@ El recolector estÃ¡ principalmente contenido en la estructura llamada ``Gcx``.
 Dicha estructura tiene los siguientes atributos (divididos en categorÃ­as para
 facilitar la comprensiÃ³n):
 
-**RaÃ­ces definidas por el usuario**
-
-   *roots* (*nroots*, *rootdim*):
+RaÃ­ces definidas por el usuario
+   *roots* (*nroots*, *rootdim*)
       arreglo variable de punteros simples que son tomados como raÃ­ces
       provistas por el usuario.
 
-   *ranges* (*nranges*, *rangedim*):
+   *ranges* (*nranges*, *rangedim*)
       arreglo variable de rangos de memoria que deben ser revisados (de forma
       conservativa) como raÃ­ces provistas por el usuario. Un rango es una
       estructura con dos punteros: ``pbot`` y ``ptop``. Toda la memoria entre
       estos dos punteros se toma, palabra por palabra, como una raÃ­z del
       recolector.
 
-**Estado interno del recolector**
-
-   *anychanges*:
+Estado interno del recolector
+   *anychanges*
       variable que indica si en la fase de marcado se encontraron nuevas
       celdas con punteros que deban ser visitados. Otra forma de verlo es como
       un indicador de si el conjunto de celdas *grises* estÃ¡ vacÃ­o luego de
@@ -974,36 +986,35 @@ facilitar la comprensiÃ³n):
       <gc_intro_tricolor>`). Es anÃ¡loga a la variable ``more_to_scan``
       presentada en :ref:`dgc_algo_mark`.
 
-   *inited*:
+   *inited*
       indica si el recolector fue inicializado.
 
-   *stackBottom*:
+   *stackBottom*
       puntero a la base del *stack* (asumiendo que el stack crece hacia arriba).
       Se utiliza para saber por donde comenzar a visitar el *stack* de forma
       conservativa, tomÃ¡ndolo con una raÃ­z del recolector.
 
-   *Pools* (*pooltable*, *npools*):
+   *Pools* (*pooltable*, *npools*)
       arreglo variable de punteros a estructuras ``Pool`` (ver mÃ¡s adelante).
       Este arreglo se mantiene siempre ordenado de menor a mayor segÃºn la
       direcciÃ³n de memoria de la primera pÃ¡gina que almacena.
 
-   *bucket*:
+   *bucket*
       listas de libres. Es un arreglo de estructuras ``List`` utilizadas para
       guardar la listas de libres de todos los tamaÃ±os de bloques posibles (ver
       mÃ¡s adelante).
 
-**Atributos que cambian el comportamiento**
-
-   *noStack*:
+Atributos que cambian el comportamiento
+   *noStack*
       indica que no debe tomarse al *stack* como raÃ­z del recolector. Esto es
       muy poco seguro y no deberÃ­a ser utilizado nunca, salvo casos
       extremadamente excepcionales.
 
-   *log*:
+   *log*
       indica si se debe guardar un registro de la actividad del recolector. Es
       utilizado principalmente para depuraciÃ³n.
 
-   *disabled*:
+   *disabled*
       indica que no se deben realizar recolecciones implÃ­citamente. Si al
       tratar de asignar memoria no se puede hallar celdas libres en el *heap*
       del recolector, se pide mÃ¡s memoria al sistema operativo sin correr una
@@ -1012,16 +1023,15 @@ facilitar la comprensiÃ³n):
       se pueden tolerar grandes pausas como las que puede provocar el
       recolector.
 
-**Optimizaciones**
-
-   *p_cache*, *size_cache*:
+Optimizaciones
+   *p_cache*, *size_cache*
       obtener el tamaÃ±o de un bloque dado un puntero es una tarea costosa
       y comÃºn. Para evitarla en casos donde se calcula de forma sucesiva el
       tamaÃ±o del mismo bloque (como puede ocurrir al concatenar arreglos
       dinÃ¡micos) se guarda el Ãºltimo calculado en estas variables a modo de
       *cachÃ©*.
 
-   *minAddr*, *maxAddr*:
+   *minAddr*, *maxAddr*
       punteros al principio y fin del *heap*. Pueden haber *huecos* entre
       estos dos punteros que no pertenezcan al *heap* pero siempre se cumple
       que si un puntero apunta al *heap* debe estar en este rango. Esto es
@@ -1048,29 +1058,51 @@ C ``malloc()``, ``realloc()`` y ``free()`` directamente.
 La estructura ``Pool`` estÃ¡ compuesta por los siguientes atributos (ver figura
 :vref:`fig:dgc-pool`):
 
-*baseAddr* y *topAddr*:
+.. fig:: fig:dgc-pool
+
+   Vista grÃ¡fica de la estructura de un *pool* de memoria.
+
+   .. aafig::
+      :scale: 120
+
+                /---  "baseAddr"    "ncommitted = i"          "topAddr" ---\
+                |                       V                                  |
+                |/                      |/                                 |/
+                +----  "committed" -----+-------  "no committed" ----------+
+               /|                      /|                                 /|
+                V                       V                                  V
+                +--------+--------+-----+--------+-----+-------------------+
+        pÃ¡ginas |   0    |   0    | ... |   i    | ... |    "npages - 1"   |
+                +--------+--------+-----+--------+-----+-------------------+
+                    A        A      A       A      A           A
+                    |        |      |       |      |           |
+                +--------+--------+-----+--------+-----+-------------------+
+      pagetable | Bins 0 | Bins 1 | ... | Bins i | ... | "Bins (npages-1)" |
+                +--------+--------+-----+--------+-----+-------------------+
+
+*baseAddr* y *topAddr*
    punteros al comienzo y fin de la memoria que almacena todas las pÃ¡ginas del
    *pool* (*baseAddr* es anÃ¡logo al atributo *pages* utilizado en las
    secciones anteriores para mayor claridad).
 
-*mark*, *scan*, *freebits*, *finals*, *noscan*:
+*mark*, *scan*, *freebits*, *finals*, *noscan*
    conjunto de bits (*bitsets*) para almacenar los indicadores descriptos en
    :ref:`dgc_org` para todos los bloques de todas las pÃ¡ginas del *pool*.
    *freebits* es anÃ¡logo a *free* y *finals* a *final* en los atributos
    descriptos en las secciones anteriores.
 
-*npages*:
+*npages*
    cantidad de pÃ¡ginas que contiene este *pool* (fue nombrado
    *number_of_pages* en las secciones anteriores para mayor claridad).
 
-*ncommitted*:
+*ncommitted*
    cantidad de pÃ¡ginas *encomendadas* al sistema operativo (*committed* en
    inglÃ©s). Este atributo no se mencionÃ³ anteriormente porque el manejo de
    pÃ¡ginas encomendadas le agrega una complejidad bastante notable al
    recolector y es solo una optimizaciÃ³n para un sistema operativo en
    particular (Microsoft Windows).
 
-*pagetable*:
+*pagetable*
    arreglo de indicadores de tamaÃ±o de bloque de cada pÃ¡gina de este *pool*.
    Los indicadores vÃ¡lidos son ``B_16`` a ``B_2048`` (pasando por los valores
    posibles de bloque mencionados anteriormente, todos con el prefijo
@@ -1078,28 +1110,6 @@ La estructura ``Pool`` estÃ¡ compuesta por los siguientes atributos (ver figura
    ``B_UNCOMMITTED`` (valor que tienen las pÃ¡ginas que no fueron encomendadas
    aÃºn) y ``B_FREE``.
 
-.. fig:: fig:dgc-pool
-
-   Vista grÃ¡fica de la estructura de un *pool* de memoria.
-
-   .. aafig::
-      :scale: 120
-
-                /---  "baseAddr"    "ncommitted = i"          "topAddr" ---\
-                |                       V                                  |
-                |/                      |/                                 |/
-                +----  "committed" -----+-------  "no committed" ----------+
-               /|                      /|                                 /|
-                V                       V                                  V
-                +--------+--------+-----+--------+-----+-------------------+
-        pÃ¡ginas |   0    |   0    | ... |   i    | ... |    "npages - 1"   |
-                +--------+--------+-----+--------+-----+-------------------+
-                    A        A      A       A      A           A
-                    |        |      |       |      |           |
-                +--------+--------+-----+--------+-----+-------------------+
-      pagetable | Bins 0 | Bins 1 | ... | Bins i | ... | "Bins (npages-1)" |
-                +--------+--------+-----+--------+-----+-------------------+
-
 Como se observa, ademÃ¡s de la informaciÃ³n particular del *pool* se almacena
 toda la informaciÃ³n de pÃ¡ginas y bloques enteramente en el *pool* tambiÃ©n.
 Esto simplifica el manejo de que lo es memoria *pura* del *heap*, ya que queda
@@ -1144,56 +1154,54 @@ A continuaciÃ³n se resumen las funciones principales, separadas en categorÃ­as
 para facilitar la comprensiÃ³n. Los siguientes son mÃ©todos de la estructura
 ``Gcx``:
 
-**InicializaciÃ³n y terminaciÃ³n**
-
-   *initialize()*:
+InicializaciÃ³n y terminaciÃ³n
+   *initialize()*
       inicializa las estructuras internas del recolector para que pueda ser
       utilizado. Esta funciÃ³n la llama la biblioteca *runtime* antes de que el
       programa comience a correr.
 
-   *Dtor()*:
+   *Dtor()*
        libera todas las estructuras que utiliza el recolector.
 
-**ManipulaciÃ³n de raÃ­ces definidas por el usuario**
-
-   *addRoot(p)*, *removeRoot(p)*, *rootIter(dg)*:
+ManipulaciÃ³n de raÃ­ces definidas por el usuario
+   *addRoot(p)*, *removeRoot(p)*, *rootIter(dg)*
       agrega, remueve e itera sobre las raÃ­ces simples definidas por el
       usuario.
 
-   *addRange(pbot, ptop)*, *remove range(pbot)*, *rangeIter(dg)*:
+   *addRange(pbot, ptop)*, *remove range(pbot)*, *rangeIter(dg)*
       agrega, remueve e itera sobre los rangos de raÃ­ces definidas por el
       usuario.
 
-**ManipulaciÃ³n de indicadores**
-
-   Cada bloque (*bin* en la terminologÃ­a de la implementaciÃ³n del recolector)
-   tiene ciertos indicadores asociados. Algunos de ellos pueden ser
-   manipulados (indirectamente) por el usuario utilizando estas funciones:
-
-   *getBits(pool, biti)*:
+ManipulaciÃ³n de indicadores
+   *getBits(pool, biti)*
       obtiene los indicadores especificados para el bloque de Ã­ndice ``biti``
       en el *pool* ``pool``.
 
-   *setBits(pool, biti, mask)*:
+   *setBits(pool, biti, mask)*
       establece los indicadores especificados en ``mask`` para el bloque de
       Ã­ndice ``biti`` en el *pool* ``pool``.
 
-   *clrBits(pool, biti, mask)*:
+   *clrBits(pool, biti, mask)*
       limpia los indicadores especificados en ``mask`` para el bloque de
       Ã­ndice ``biti`` en el *pool* ``pool``.
 
+   Cada bloque (*bin* en la terminologÃ­a de la implementaciÃ³n del recolector)
+   tiene ciertos indicadores asociados. Algunos de ellos pueden ser
+   manipulados (indirectamente) por el usuario utilizando las funciones
+   mencionadas arriba.
+
    El parÃ¡metro ``mask`` debe ser una mÃ¡scara de bits que puede estar
    compuesta por la conjunciÃ³n de los siguientes valores:
 
-   *FINALIZE*:
+   *FINALIZE*
       el objeto almacenado en el bloque tiene un destructor (indicador
       *finals*).
 
-   *NO_SCAN*:
+   *NO_SCAN*
       el objeto almacenado en el bloque no contiene punteros (indicador
       *noscan*).
 
-   *NO_MOVE*:
+   *NO_MOVE*
       el objeto almacenado en el bloque no debe ser movido [#dgcmove]_.
 
 .. [#dgcmove] Si bien el recolector actual no tiene la capacidad de mover
@@ -1202,44 +1210,39 @@ para facilitar la comprensiÃ³n. Los siguientes son mÃ©todos de la estructura
    fijar objetos apuntados desde algÃºn segmento no conservativo (objeto
    *pinned*).
 
-**BÃºsquedas**
-
-   *findPool(p)*:
+BÃºsquedas
+   *findPool(p)*
       busca el *pool* al que pertenece el objeto apuntado por ``p``.
 
-   *findBase(p)*:
+   *findBase(p)*
       busca la direcciÃ³n base (el inicio) del bloque apuntado por ``p``
       (``find_block()`` segÃºn la secciÃ³n :ref:`dgc_algo_mark`).
 
-   *findSize(p)*:
+   *findSize(p)*
       busca el tamaÃ±o del bloque apuntado por ``p``.
 
-   *getInfo(p)*:
+   *getInfo(p)*
       obtiene informaciÃ³n sobre el bloque apuntado por ``p``. Dicha
       informaciÃ³n se retorna en una estructura ``BlkInfo`` que contiene los
       siguientes atributos: ``base`` (direcciÃ³n del inicio del bloque),
       ``size`` (tamaÃ±o del bloque) y ``attr`` (atributos o indicadores del
       bloque, los que se pueden obtener con ``getBits()``).
 
-   *findBin(size)*:
+   *findBin(size)*
       calcula el tamaÃ±o de bloque mÃ¡s pequeÃ±o que pueda contener un objeto de
       tamaÃ±o ``size`` (``find_block_size()`` segÃºn lo visto en
       :ref:`dgc_algo_alloc`).
 
-**AsignaciÃ³n de memoria**
-
-   Recordar que la ``pooltable`` siempre se mantiene ordenada segÃºn la
-   direcciÃ³n de la primera pÃ¡gina.
-
-   *reserve(size)*:
+AsignaciÃ³n de memoria
+   *reserve(size)*
       reserva un nuevo *pool* de al menos ``size`` bytes. El algoritmo nunca
       crea un *pool* con menos de 256 pÃ¡ginas (es decir, 1 MiB).
 
-   *minimize()*:
+   *minimize()*
       minimiza el uso de la memoria retornando *pools* sin pÃ¡ginas usadas al
       sistema operativo.
 
-   *newPool(n)*:
+   *newPool(n)*
       reserva un nuevo *pool* con al menos ``n`` pÃ¡ginas. Junto con
       ``Pool.initialize()`` es anÃ¡loga a ``new_pool()``, solo que esta funciÃ³n
       siempre incrementa el nÃºmero de pÃ¡ginas a, al menos, 256 pÃ¡ginas (es
@@ -1251,7 +1254,7 @@ para facilitar la comprensiÃ³n. Los siguientes son mÃ©todos de la estructura
       3 MiB y asÃ­ sucesivamente hasta 8 MiB. A partir de ahÃ­ siempre crea
       *pools* de 8 MiB o la cantidad pedida, si Ã©sta es mayor.
 
-   *Pool.initialize(n_pages)*:
+   *Pool.initialize(n_pages)*
       inicializa un nuevo *pool* de memoria. Junto con ``newPool()`` es
       anÃ¡loga a ``new_pool()``. Mientras ``newPool()`` es la encargada de
       calcular la cantidad de pÃ¡ginas y crear el objeto *pool*, esta funciÃ³n
@@ -1261,23 +1264,23 @@ para facilitar la comprensiÃ³n. Los siguientes son mÃ©todos de la estructura
       atributo ``FINALIZE`` a un bloque, se inicializa el conjunto de bits
       ``finals`` de todo el *pool*.
 
-   *allocPage(bin)*:
+   *allocPage(bin)*
       asigna a una pÃ¡gina libre el tamaÃ±o de bloque ``bin`` y enlaza los
       nuevos bloques libres a la lista de libres correspondiente (anÃ¡logo
       a ``assign_page()``).
 
-   *allocPages(n)*:
+   *allocPages(n)*
       Busca ``n`` cantidad de pÃ¡ginas consecutivas libres (anÃ¡loga
       a ``find_pages(n)``).
 
-   *malloc(size, bits)*:
+   *malloc(size, bits)*
       asigna memoria para un objeto de tamaÃ±o ``size`` bytes. AnÃ¡loga al
       algoritmo ``new(size, attr)`` presentado, excepto que introduce ademÃ¡s
       un cachÃ© para no recalcular el tamaÃ±o de bloque necesario si se realizan
       mÃºltiples asignaciones consecutivas de objetos del mismo tamaÃ±o y que la
       asignaciÃ³n de objetos pequeÃ±os no estÃ¡ separada en una funciÃ³n aparte.
 
-   *bigAlloc(size)*:
+   *bigAlloc(size)*
       asigna un objeto grande (anÃ¡logo a ``new_big()``). La implementaciÃ³n es
       mucho mÃ¡s compleja que la presentada en ``new_big()``, pero la semÃ¡ntica
       es la misma. La Ãºnica diferencia es que esta funciÃ³n aprovecha que
@@ -1286,19 +1289,19 @@ para facilitar la comprensiÃ³n. Los siguientes son mÃ©todos de la estructura
       el caso en que no se liberaron suficientes pÃ¡ginas para asignar el
       objeto grande y pasar directamente a crear un nuevo *pool*.
 
-   *free(p)*:
+   *free(p)*
       libera la memoria apuntada por ``p`` (anÃ¡loga a ``delete()`` de la
       secciÃ³n anterior).
 
-**RecolecciÃ³n**
+   Recordar que la ``pooltable`` siempre se mantiene ordenada segÃºn la
+   direcciÃ³n de la primera pÃ¡gina.
 
-   *mark(pbot, ptop)*:
-      marca un rango de memoria. Este mÃ©todo es anÃ¡logo al ``mark()``
-      presentado en la secciÃ³n :ref:`dgc_algo_mark` pero marca un rango
-      completo de memoria, lo que permite que sea considerablemente mÃ¡s
-      eficiente.
+RecolecciÃ³n
+   *mark(pbot, ptop)*
+      marca un rango de memoria. Este mÃ©todo es anÃ¡logo al ``mark_range()``
+      presentado en la secciÃ³n :ref:`dgc_algo_mark`.
 
-   *fullcollectshell()*:
+   *fullcollectshell()*
       guarda los registros en el *stack* y llama a ``fullcollect()``. El
       algoritmo presentado en :ref:`dgc_algo_mark` es simbÃ³lico, ya que si los
       registros se apilaran en el *stack* dentro de otra funciÃ³n, al salir de
@@ -1306,7 +1309,7 @@ para facilitar la comprensiÃ³n. Los siguientes son mÃ©todos de la estructura
       funciÃ³n ``collect()`` o en una funciÃ³n que luego la llame (como en este
       caso).
 
-   *fullcollect(stackTop)*:
+   *fullcollect(stackTop)*
       realiza la recolecciÃ³n de basura. Es anÃ¡loga a ``collect()`` pero es
       considerablemente menos modular, todos los pasos se hacen directamente
       en esta funciÃ³n: marcado del *root set*, marcado iterativo del *heap*,
@@ -1328,6 +1331,8 @@ a ningÃºn destructor), para el usuario puede ser una garantÃ­a muy dÃ©bil
 y proveer finalizaciÃ³n asegurada puede ser muy deseable.
 
 
+.. _dgc_committed:
+
 Memoria *encomendada*
 ^^^^^^^^^^^^^^^^^^^^^
 El algoritmo actual divide un *pool* en dos Ã¡reas: memoria *encomendada*
@@ -1432,6 +1437,73 @@ utiliza conjuntos de bits. Esto trae dos ventajas principales:
   considerablemente la fase de marcado.
 
 
+.. _dgc_debug:
+
+Herramientas para depuraciÃ³n
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+
+El recolector provee algunas opciones para simplificar el diagnÃ³stico
+y depuraciÃ³n de problemas, tanto del mismo recolector como del programa del
+usuario.
+
+Las opciones mÃ¡s importantes son:
+
+
+``MEMSTOMP``
+   Su funciÃ³n es escribir un patrÃ³n determinado de bits en todos los bytes de
+   un bloque de memoria segÃºn se haya:
+
+   * Pedido un bloque menor a una pÃ¡gina (``0xF0``).
+   * Pedido un bloque mayor a una pÃ¡gina (``0xF1``).
+   * Dejado de usar debido a un pedido de achicamiento de un bloque
+     (``0xF2``).
+   * Pedido mÃ¡s pÃ¡ginas debido a un pedido de agrandamiento de un bloque
+     (``0xF0``).
+   * Liberado intencionalmente por el usuario (``0xF2``).
+   * Barrido (``0xF3``).
+
+   Esto permite al diagnosticar un problema saber, por ejemplo, si un
+   determinado Ã¡rea de memoria fue recolectada recientemente, o liberada por
+   el usuario, o reciÃ©n adquirida, etc. con tan solo ver si un patrÃ³n de bits
+   determinado estÃ¡ presente. Por supuesto puede existir *falsos positivos*
+   pero su probabilidad es lo suficientemente baja como para que sea Ãºtil en
+   la prÃ¡ctica.
+
+``SENTINEL``
+   Su funciÃ³n detectar errores producidos por escribir mÃ¡s allÃ¡ (o antes) del
+   Ã¡rea de memoria solicitada y estÃ¡ implementado reservando un poco mÃ¡s de
+   memoria de la que pide el usuario, devolviendo un puntero a un bloque
+   ubicado dentro del bloque real reservado (en vez de al inicio) y finalmente
+   escribiendo un patrÃ³n de bits en los extremos del borde real (ver figura
+   :vref:`fig:sentinel`), de forma de poder verificar en distintas situaciÃ³n
+   (por ejemplo al barrer el bloque) que esas Ã¡reas de mÃ¡s con los patrones de
+   bits estÃ©n intactas. Esto permite detectar de forma temprana errores tanto
+   en el recolector como en el programa del usuario.
+
+   .. fig:: fig:sentinel
+
+      Esquema de un bloque cuando estÃ¡ activada la opciÃ³n ``SENTINEL``.
+
+      .. aafig::
+         :textual:
+
+         |              |              |                              |        |
+         +-- Palabra ---+-- Palabra ---+-- TamaÃ±o bloque de usuario --+- Byte -+
+         |              |              |                              |        |
+
+         +--------------+--------------+------------------------------+--------+
+         | "TamaÃ±o del" |     Pre      |                              |  Post  |
+         |  "bloque de" |              |      Bloque de usuario       |        |
+         |   "usuario"  |  0xF4F4F4F4  |                              |  0xF5  |
+         +--------------+--------------+------------------------------+--------+
+                                       A
+                                       |
+                   Puntero devuleto ---/
+
+Ambas opciones son seleccionables sÃ³lo en tiempo de compilaciÃ³n del
+recolector, por lo que su utilidad real, al menos para el usuario, se ve
+severamente reducida.
+
 
 .. _dgc_bad:
 
@@ -1445,6 +1517,8 @@ participaciÃ³n y observaciÃ³n del grupo de noticias, de donde se obtuvieron los
 principales problemas percibidos por la comunidad que utiliza el lenguaje.
 
 
+.. _dgc_bad_code:
+
 Complejidad del cÃ³digo y documentaciÃ³n
 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
 El anÃ¡lisis del cÃ³digo fue muy complicado debido a la falta de documentaciÃ³n
@@ -1459,6 +1533,8 @@ recolector actual y en consecuencia sea muy complicado escribir documentaciÃ³n
 o mejorarlo. Esto a su vez provoca que, al no disponer de una implementaciÃ³n
 de referencia sencilla, sea muy difÃ­cil implementar un recolector nuevo.
 
+.. highlight:: d
+
 Este es, probablemente, la raÃ­z de todos los demÃ¡s problemas del recolector
 actual. Para ilustrar la dimensiÃ³n del problema se presenta la implementaciÃ³n
 real de la funciÃ³n ``bigAlloc()``::
@@ -1593,8 +1669,8 @@ y en particular para mejorar la implementaciÃ³n de de arreglos asociativos.
 Referencias dÃ©biles
 ^^^^^^^^^^^^^^^^^^^
 El recolector actual no dispone de soporte de *referencias dÃ©biles*
-[#dgcweakref]_, sin embargo hay una demanda [NGD86840]_ [NGD13301]_ [NGL8264]_
-[NGD69761]_ [NGD74624]_ [NGD88065]_
+[#dgcweakref]_, sin embargo hay una demanda apreciable [NGD86840]_ [NGD13301]_
+[NGL8264]_ [NGD69761]_ [NGD74624]_ [NGD88065]_.
 
 .. [#dgcweakref] Una referencia dÃ©bil (o *weak reference* en inglÃ©s) es
    aquella que que no protege al objeto referenciado de ser reciclado por el
@@ -1603,7 +1679,7 @@ El recolector actual no dispone de soporte de *referencias dÃ©biles*
 Para cubrir esta demanda, se han implementado soluciones como biblioteca para
 suplir la inexistencia de una implementaciÃ³n oficial [NGA9103]_.
 
-Sin embargo Ã©stas son en general poco robustas y extremadamente dependientes
+Sin embargo Ã©stas son en general poco robustas, extremadamente dependientes
 de la implementaciÃ³n del recolector y, en general, presentan problemas muy
 sutiles [NGD88065]_. Por esta razÃ³n se ha discutido la posibilidad de incluir
 la implementaciÃ³n de *referencias dÃ©biles* como parte del lenguaje
@@ -1671,18 +1747,49 @@ bits para la fase de marcado, el resto del algoritmo es casi la versiÃ³n mÃ¡s
 bÃ¡sica de marcado y barrido. Hay mucho lugar para mejoras en este sentido.
 
 
+Configurabilidad
+^^^^^^^^^^^^^^^^
+Si bien el recolector actual tiene algunas caracterÃ­sticas configurables,
+todas son seleccionables sÃ³lo en tiempo de compilaciÃ³n del recolector (no del
+programa del usuario), como por ejemplo las opciones descriptas en
+:ref:`dgc_debug`. Por lo tanto, a nivel prÃ¡ctico, es como si no tuviera
+posibilidad alguna de ser configurado por el usuario, ya que no es parte del
+ciclo de desarrollo normal el recompilar el recolector o *runtime* de un
+lenguaje.
+
+Dado que es imposible que un recolector sea Ã³ptimo para todo tipo de
+programas, es muy deseable permitir una configuraciÃ³n de parÃ¡metros del
+recolector que permitan al usuario ajustarlo a las necesidades particulares de
+sus programas.
+
+
+.. _dgc_bad_ocup:
+
+Factor de ocupaciÃ³n del *heap*
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Otro problema potencialmente importante del recolector actual es que no se
+tiene ningÃºn cuidado con respecto a que, luego de una recolecciÃ³n, se haya
+recuperado una buena parte del *heap*. Por lo tanto, en casos extremos, el
+recolector tiene que hacer una recolecciÃ³n por cada peticiÃ³n de memoria, lo
+que es extremadamente ineficiente.
+
+Para evitar esto, habrÃ­a que usar algÃºn esquema para evaluar cuando una
+recolecciÃ³n no fue lo suficientemente *exitosa* y en ese caso pedir mÃ¡s
+memoria al sistema operativo.
+
+
 Detalles
 ^^^^^^^^
 Finalmente hay varios detalles en la implementaciÃ³n actual que podrÃ­an
 mejorarse:
 
-Listas de libres:
+Listas de libres
    hay 12 listas de libres, como para guardar bloques de tamaÃ±o de ``B_16``
    a ``B_2048``, ``B_PAGE``, ``B_PAGEPLUS``, ``B_UNCOMMITTED`` y ``B_FREE``;
    sin embargo solo tienen sentido los bloques de tamaÃ±o ``B_16``
    a ``B_2048``, por lo que 4 de esas listas no se utilizan.
 
-Conjuntos de bits para indicadores:
+Conjuntos de bits para indicadores
    los indicadores para la fase de marcado y otras propiedades de un bloque
    son almacenados en conjuntos de bits que almacenan los indicadores de todos
    los bloques de un *pool*. Si bien se ha mencionado esto como una ventaja,
@@ -1697,27 +1804,325 @@ Conjuntos de bits para indicadores:
    objeto grande; lo que equivaldrÃ­a al 2560 objetos de 16 bytes
    desperdiciados en bits inutilizados).
 
-RepeticiÃ³n de cÃ³digo:
+RepeticiÃ³n de cÃ³digo
    Hay algunos fragmentos de cÃ³digo repetidos innecesariamente. Por ejemplo en
    varios lugares se utilizan arreglos de tamaÃ±o variable que se implementan
    repetidas veces (en general como un puntero al inicio del arreglo mÃ¡s el
    tamaÃ±o actual del arreglo mÃ¡s el tamaÃ±o de la memoria total asignada
    actualmente). Esto es propenso a errores y difÃ­cil de mantener.
 
-Uso de seÃ±ales:
+Uso de seÃ±ales
    el recolector actual utiliza las seÃ±ales del sistema operativo ``SIGUSR1``
    y ``SIGUSR2`` para pausar y reanudar los hilos respectivamente. Esto
    puede traer inconvenientes a usuarios que desean utilizar estas
    seÃ±ales en sus programas (o peor aÃºn, si interactÃºan con bibliotecas
    de C que hacen uso de estas seÃ±ales) [NGD5821]_.
 
-Marcado iterativo:
+Marcado iterativo
    si bien esto se mencionÃ³ como algo bueno del recolector actual, es un
    compromiso entre tiempo y espacio, y puede ser interesante analizar otros
    mÃ©todos para evitar la recursiÃ³n que no requieran tantas pasadas sobre el
    *heap*.
 
 
+
+.. Esto serÃ­a muy similar a la secciÃ³n de "RecolecciÃ³n de basura) pero en
+   vez de ir describiendo los algoritmos irÃ­a comentando por quÃ© los tomo
+   o descarto
+   ESTADO: INCOMPLETO
+
+
+.. _dgc_via:
+
+AnÃ¡lisis de viabilidad
+----------------------------------------------------------------------------
+
+Ya conociendo el lenguaje de programaciÃ³n D_ (con sus necesidades
+particulares), el estado del arte en recolecciÃ³n de basura  y el recolector
+actual de D_ es posible evaluar la viabilidad de los distintos algoritmos
+vistos en el capÃ­tulo :ref:`gc`. Se recuerda que dentro del anÃ¡lisis de
+viabilidad de considera de gran importancia la viabilidad social y polÃ­tica de
+la mejora, es decir, se presta particular atenciÃ³n en encontrar una mejora que
+tenga una buena probabilidad de ser aceptada por la comunidad de D_.
+
+
+.. _dgc_via_classic:
+
+Algoritmos clÃ¡sicos
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+En esta secciÃ³n se presenta un anÃ¡lisis de los :ref:`algoritmos clÃ¡sicos
+<gc_classic>`, de forma de poder analizar a grandes rasgos las principales
+familias para ir determinando la direcciÃ³n principal de la soluciÃ³n.
+
+
+.. _dgc_via_rc:
+
+Conteo de referencias
+^^^^^^^^^^^^^^^^^^^^^
+Ya se ha propuesto en el pasado la utilizaciÃ³n de conteo de referencias en D_
+pero no se ha demostrado un interÃ©s real, mÃ¡s allÃ¡ de soluciones en
+bibliotecas [NGD38689]_. Las razones para no utilizar conteo de referencia son
+mÃ¡s o menos las mismas que las desventajas mencionadas en la secciÃ³n
+:ref:`gc_rc` (en el capÃ­tulo :ref:`gc`), siendo la principal la incapacidad de
+recolectar ciclos. Sin embargo hay otras razones importantes.
+
+Una de ellas es la inter-operatividad con C. El utilizar un contador de
+referencias requiere la manipulaciÃ³n del contador por parte del cÃ³digo C con
+el que se interactÃºe. Si bien este problema ya estÃ¡ presente si cÃ³digo
+C guarda un puntero a un objeto almacenado en el *heap* del recolector de D_
+en el *heap* de C (es decir, en una celda de memoria asignada por
+``malloc()``), esto es poco comÃºn. Sin embargo, mientras que una funciÃ³n de
+C se estÃ¡ ejecutando, es extremadamente comÃºn que pueda almacenar en el
+*stack* una referencia a un objeto de D_ y en ese caso el recolector actual
+puede manejarlo (mientras la funciÃ³n de C estÃ© corriendo en un hilo creado por
+D_). Sin embargo al usar un conteo de referencias esto es mÃ¡s problemÃ¡tico, ya
+que no se mantiene la invariante del algoritmo si no son actualizados siempre
+los contadores.
+
+Otro problema es que al liberarse una celda, existe la posibilidad de tener
+que liberar todo el sub-grafo conectado a Ã©sta. Cuando este sub-grafo es
+grande, se puede observar una gran pausa.
+
+Si bien estas razones son suficientes como para considerar que el conteo de
+referencias no es un algoritmo que sea viable en D_, hay muchas tÃ©cnicas
+y optimizaciones para minimizarlas (como liberaciÃ³n perezosa, conteo de
+referencias pospuesto, etc. [JOLI96]_). Sin embargo hay otra razÃ³n importante
+que descarta esta familia de algoritmos ya que todas las variaciones de conteo
+de referencias implican, en mayor o menor medida, el entrelazado del trabajo
+del recolector con el del *mutator*. Si bien esta es una caracterÃ­stica en
+general muy deseable (porque hace que el recolector sea :ref:`incremental
+<gc_inc>`), en D_ no lo es porque tiene como requerimiento no hacer pagar el
+precio de cosas que no se usan. En D_ debe ser posible no utilizar el
+recolector de basura y, al no hacerlo, no tener ningÃºn tipo de trabajo extra
+asociado a Ã©ste. De usarse conteo de referencias esto no serÃ­a posible.
+
+Si bien este requerimiento puede ser discutible tÃ©cnicamente, hay una gran
+resistencia social y polÃ­tica ante cualquier tipo de recolector que imponga
+una penalizaciÃ³n de rendimiento a alguien que no quiera usarlo [NGD38689]_.
+AdemÃ¡s requiere un cambio complejo y profundo en el compilador, siendo Ã©ste
+uno de los eslabones con mayor resistencia a introducir cambios.
+
+Por lo tanto se concluye que el conteo de referencias no es un algoritmo
+viable para este trabajo.
+
+
+.. _dgc_via_mark_sweep:
+
+Marcado y barrido
+^^^^^^^^^^^^^^^^^
+El marcado y barrido es un algoritmo evidentemente viable debido a que es la
+base del algoritmo del recolector de basura actual.
+
+En general en la comunidad de D_ no hay mayores crÃ­ticas al marcado y barrido
+en sÃ­, si no mÃ¡s bien a problemas asociados a la implementaciÃ³n actual,
+principalmente a las grandes pausas o la falta de :ref:`precisiÃ³n
+<gc_conserv>` [NGD54084]_ [NGL13744]_ [NGD44607]_ [NGD29291]_ [NGDN87831]_
+[NGDN87831]_ [NGL3937]_ [NGD22968]_ [NGA15246]_ [NGD5622]_ [NGD2547]_
+[NGD18354]_.
+
+Esta familia de algoritmos se adapta bien a los requerimientos principales de
+D_ en cuanto a recolecciÃ³n de basura (ver :ref:`dgc_needs`), por ejemplo
+permite recolectar de forma conservativa, no impone un *overhead* a menos que
+se utilice el recolector, permite liberar memoria manualmente, se adapta de
+forma simple para soportar punteros *interiores* y permite finalizar objetos
+(con las limitaciones mencionadas en :ref:`dgc_prob_final`).
+
+Sin embargo muchas de las limitaciones del recolector actual (ver
+:ref:`dgc_bad`), no son inherentes al marcado y barrido, por lo que aÃºn
+conservando la base del algoritmo, es posible realizar una cantidad de mejoras
+considerable.
+
+Una de las principales mejoras que pueden realizarse es hacer al recolector
+:ref:`concurrente <gc_concurrent>` y parcialmente mÃ¡s :ref:`preciso
+<gc_conserv>`. Estas dos mejoras solamente alcanzarÃ­an para mejorar de forma
+notable el tiempo de pausa en las recolecciones y la cantidad de memoria
+retenida debido a falsos positivos.
+
+MÃ¡s adelante veremos detalles sobre algunos de estos aspectos y sobre algunos
+algoritmos particulares que permiten hacer concurrente al recolector actual.
+
+
+Copia de semi-espacio
+^^^^^^^^^^^^^^^^^^^^^
+La copia de semi-espacio, al igual que cualquier otro tipo de recolector con
+movimiento, requiere (en la mayorÃ­a de los casos) disponer de una
+:ref:`precisiÃ³n <gc_conserv>` casi completa. Las celdas para las cuales hay
+alguna referencia que no es precisa no pueden ser movidas, ya que al no estar
+seguros que la referencia sea tal, Ã©sta no puede ser actualizada con la
+direcciÃ³n de la nueva ubicaciÃ³n de la celda movida porque de no ser una
+referencia se estarÃ­an alterando datos del usuario, corrompiÃ©ndolos.
+
+Es por esto que si el recolector no es mayormente preciso, las celdas que
+pueden ser movidas son muy pocas y, por lo tanto, se pierden las principales
+ventajas de esta familia de recolectores (como la capacidad de asignar nueva
+memoria mediante *pointer bump allocation*).
+
+Este aumento de precisiÃ³n, sin embargo, es bastante realizable. Es posible, en
+teorÃ­a, hacer que al menos el *heap* sea preciso, aunque es discutible si en
+la prÃ¡ctica es aceptable el *overhead* en espacio necesario para almacenar la
+informaciÃ³n del tipo de una celda. Esto se analiza en mÃ¡s detalle al evaluar
+la recolecciÃ³n precisa en la siguiente secciÃ³n.
+
+Si bien las principales herramientas para que sea viable un recolector por
+copia de semi-espacio estÃ¡n disponibles en D_ (como la posibilidad de hacer
+*pinning* the celdas o el potencial incremento de precisiÃ³n), este lenguaje
+nunca va a poder proveer precisiÃ³n total, haciendo que no sea posible
+implementar un recolector por copia de semi-espacio puro. Siempre habrÃ¡ que
+disponer un esquema hÃ­brido para poder manejar las celdas que no puedan
+moverse, incrementado mucho la complejidad del recolector.
+
+Si bien un esquema hÃ­brido es algo tÃ©cnicamente posible, nuevamente la
+resistencia social a un cambio de esta envergadura es de importancia
+suficiente como para inclinarse por una soluciÃ³n menos drÃ¡stica.
+
+
+.. _dgc_via_art:
+
+Principales categorÃ­as del estado del arte
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+En esta secciÃ³n se realiza un anÃ¡lisis de la viabilidad de las principales
+categorÃ­as de recolectores segÃºn se presentaron en la secciÃ³n :ref:`gc_art`.
+
+RecolecciÃ³n directa / indirecta
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Como se ha visto al analizar el conteo de referencias, lo mÃ¡s apropiado para
+D_ pareciera ser continuar con el esquema de recolecciÃ³n indirecta, de forma
+tal de que el precio de la recolecciÃ³n solo deba ser pagado cuando el
+*mutator* realmente necesita del recolector. Es por esto que no parece ser una
+opciÃ³n viable introducir recolecciÃ³n directa en este trabajo.
+
+
+RecolecciÃ³n incremental
+^^^^^^^^^^^^^^^^^^^^^^^
+La recolecciÃ³n incremental puede ser beneficiosa para D_, dado que puede
+servir para disminuir el tiempo de pausa del recolector. Sin embargo, en
+general es necesario instrumentar el *mutator* para reportar cambios en el
+grafo del conectividad al recolector. AdemÃ¡s puede contar con los mismos
+problemas que la recolecciÃ³n directa, puede hacer que el usuario tenga que
+pagar el precio de la recolecciÃ³n, incluso cuando no la necesita, si por cada
+asignaciÃ³n el recolector realiza parte de una recolecciÃ³n que no fue
+solicitada.
+
+RecolecciÃ³n concurrente / paralela / *stop-the-world*
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+El recolector actual es *stop-the-world*, sin embargo esta es una de las
+principales crÃ­ticas que tiene. El recolector se podrÃ­a ver beneficiado de
+recolecciÃ³n paralela, tanto para realizar la recolecciÃ³n mÃ¡s velozmente en
+ambientes multi-procesador, como para disminuir el tiempo de pausa. Sin
+embargo, el hecho de que todos los hilos se pausen para realizar parte del
+trabajo del recolector puede ser contraproducente para programas *real-time*
+que pretendan usar un hilo que no sufra de la latencia del recolector,
+asegurando que nunca lo use (aunque se podrÃ­an ver esquemas para ajustarse
+a estas necesidades).
+
+En general los recolectores concurrentes necesitan tambiÃ©n instrumentar el
+*mutator* para reportar cambios en el grafo de conectividad al recolector,
+como sucede con la recolecciÃ³n directa o incremental, sin embargo hay
+algoritmos que no tienen este requerimiento, utilizando servicios del sistema
+operativo para tener una *fotografÃ­a* de la memoria para que la fase de
+marcado pueda realizarse sin perturbar al *mutator* ni requerir de su
+cooperaciÃ³n [RODR97]_. Este tipo de algoritmos serÃ­an un buen candidato para
+D_, dado que requiere pocos cambios y es transparente al *mutator*.
+
+
+RecolecciÃ³n conservativa / precisa
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Si bien D_ puede proveer al recolector de basura informaciÃ³n de tipos para los
+objetos almacenados en el *heap*, todo recolector para D_ deberÃ¡ soportar
+cierto grado de recolecciÃ³n conservativa (ver :ref:`gc_conserv`), debido a las
+siguientes razones:
+
+* Si bien D_ podrÃ­a incorporar informaciÃ³n de tipos para el *stack*
+  (utilizando, por ejemplo, la tÃ©cnica de *shadow stack* [HEND02]_), para
+  poder interactuar con C/C++, el recolector debe poder interpretar los *stack
+  frames* [#dgcstackframe]_ de estos lenguajes, que no disponen de informaciÃ³n
+  de tipos.
+
+* Los registros del procesador tienen un problema similar, con la diferencia
+  de que el costo de implementar algo similar a *shadow stack* para los
+  registros serÃ­a impracticable, mÃ¡s allÃ¡ de que exista la misma limitaciÃ³n
+  que con el *stack* para poder interactuar con C/C++.
+
+* D_ soporta uniones (ver :ref:`d_low_level`). Para una uniÃ³n es imposible
+  determinar si un campo es un puntero o no. Por ejemplo::
+
+      union U {
+         size_t x;
+         void* p;
+      }
+
+  AquÃ­ el recolector no puede saber nunca si el valor almacenado serÃ¡ un
+  ``size_t`` o un ``void*``, por lo tanto deberÃ¡ tratar **siempre** esa
+  palabra de forma conservativa (es decir, interpretarla como un *posible*
+  puntero). Este requerimiento puede ser relajado si el usuario proveyera
+  alguna forma de determinar que tipo estÃ¡ almacenando la uniÃ³n en un
+  determinado momento. Sin embargo el costo de pedir al usuario este tipo de
+  restricciÃ³n puede ser muy alto.
+
+Sin embargo, ya hay un trabajo relacionado avanzando en este sentido, que
+agrega precisiÃ³n al marcado del *heap*. David Simcha comienza con este trabajo
+explorando la posibilidad de agregar precisiÃ³n parcial al recolector,
+generando informaciÃ³n sobre la ubicaciÃ³n de los punteros para cada tipo
+[DBZ3463]_. Su trabajo se limita a una implementaciÃ³n a nivel biblioteca de
+usuario y sobre `D 2.0`_.  Desafortunadamente su trabajo pasa desapercibido
+por un buen tiempo.
+
+Sin embargo un tiempo despuÃ©s Vincent Lang (mejor conocido como *wm4* en la
+comunidad de D_), retoma este trabajo, pero modificando el compilador DMD_
+y trabajando con `D 1.0`_ y Tango_. Es por esto que el aumento de precisiÃ³n
+parece ser un Ã¡rea fÃ©rtil para este trabajo, en particular si se colabora con
+el trabajo realizado por David y Vincent.
+
+.. [#dgcstackframe] Un *stack frame* (*marco de la pila* en castellano),
+   tambiÃ©n conocido como *activation record* (o *registro de activaciÃ³n* en
+   castellano) es una estructura de datos dependiente de la arquitectura que
+   contiene informaciÃ³n del estado de una funciÃ³n, incluyendo, por ejemplo,
+   sus variables locales, parÃ¡metros y direcciÃ³n de retorno.
+
+
+RecolecciÃ³n con movimiento de celdas
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Esta posibilidad ya se ha discutido al analizar la posibilidad de utilizar
+recolecciÃ³n con copia de semi-espacios. El trabajo mencionado en la sub-secciÃ³n
+anterior agrega informaciÃ³n suficiente como poder diferenciar que celdas se
+pueden mover y cuales no, sin embargo queda como incÃ³gnita quÃ© proporciÃ³n de
+celdas deben permanecer inmovilizadas como para evaluar si un cambio tan
+grande puede rendir frutos o no.
+
+A priori, pareciera que la relaciÃ³n cantidad y complejidad de cambios sobre
+beneficios potenciales no fuera muy favorable a esta mejora.
+
+
+Lista de libres / *pointer bump allocation*
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Como consecuencia de los puntos anteriores, no es tÃ©cnicamente posible
+realizar *pointer bump allocation* pura en D_. Al haber objetos *pinned*,
+siempre es necesario o bien contar con una lista de libres, o detectar
+*huecos* en un esquema de *pointer bump allocation*. Es por esto que parece
+ser mÃ¡s viable conservar el esquema de listas de libres.
+
+Esta mejora tambiÃ©n entra en la categorÃ­a de opciones viables pero cuya
+complejidad no parece valer la pena dada la limitada utilidad que se espera
+dadas las particulares caracterÃ­sticas de D_ en cuanto a precisiÃ³n de
+informaciÃ³n de tipos de *stack*, uniones, etc.
+
+
+RecolecciÃ³n por particiones / generacional
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Una vez mÃ¡s la recolecciÃ³n por particiones, en particular la generacional,
+requiere de la instrumentaciÃ³n del *mutator* para comunicar cambios en el
+grafo de conectividad al recolector, por lo que es poco viable. Aunque existen
+algoritmos que no necesitan este tipo de comunicaciÃ³n dado que estÃ¡
+garantizado que no existan conexiones entre celdas de las distintas
+particiones, requiere grandes cambios en el compilador y realizar anÃ¡lisis
+estÃ¡tico bastante complejo [HIRZ03]_. AdemÃ¡s al ser D_ un lenguaje de bajo
+nivel, es muy difÃ­cil garantizar que estas conexiones inter-particiones no
+puedan existir realmente; y de poder lograrlo, podrÃ­a ser demasiado
+restrictivo.
+
+
 .. include:: links.rst
 
-.. vim: set ts=3 sts=3 sw=3 et tw=78 :
+.. vim: set ts=3 sts=3 sw=3 et tw=78 spelllang=es :