X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/07cdf52d08a930a5b302cf3f9cba8d524f9a2437..6c0df59fa61822652c03d8589cbe1d0cfe8d6b26:/source/dgc.rst

diff --git a/source/dgc.rst b/source/dgc.rst
index 6afd41f..f087aef 100644
--- a/source/dgc.rst
+++ b/source/dgc.rst
@@ -4,7 +4,7 @@
    de recolecciÃ³n de basura en dicho lenguaje (se explica por quÃ© las
    particularidades descriptas en la secciÃ³n anterior complican la
    recolecciÃ³n de basura y cuales son las que mÃ¡s molestan).
-   ESTADO: TERMINADO, CORREGIDO
+   ESTADO: TERMINADO
 
 
 .. _dgc:
@@ -461,7 +461,9 @@ algoritmo::
       mark_free_lists()
       mark_static_data()
       push_registers_into_stack()
+      thread_self.stack.end = get_stack_top()
       mark_stacks()
+      pop_registers_from_stack()
       mark_user_roots()
       mark_heap()
       start_the_world()
@@ -471,15 +473,24 @@ debe finalizar: la funciÃ³n ``mark_range()`` (que veremos mÃ¡s adelante) lo pone
 en ``true`` cuando una nueva celda debe ser visitada, por lo tanto la
 iteraciÃ³n se interrumpe cuando no hay mÃ¡s celdas por visitar.
 
-Las funciones ``stop_the_world()`` y ``start_the_world()`` sencillamente
-pausan y reanudan todos los hilos respectivamente::
+Las funciones ``stop_the_world()`` y ``start_the_world()`` pausan y reanudan
+todos los hilos respectivamente (salvo el actual). Al pausar los hilos ademÃ¡s
+se guardan los registros del procesador en el *stack* y se guarda la posiciÃ³n
+actual del *stack* para que la fase de marcado pueda recorrerlos::
 
    function stop_the_world() is
       foreach thread in threads
+         if thread is thread_self
+            continue
          thread.pause()
+         push_registers_into_stack()
+         thread.stack.end = get_stack_top()
 
    function start_the_world() is
       foreach thread in threads
+         if thread is thread_self
+            continue
+         pop_registers_from_stack()
          thread.resume()
 
 La funciÃ³n ``clear_mark_scan_bits()`` se encarga de restablecer todos los
@@ -526,6 +537,13 @@ en el *stack* a travÃ©s de la funciÃ³n::
       foreach register in registers
          push(register)
 
+Y luego se descartan (no es necesario ni correcto restablecer los valores ya
+que podrÃ­an tener nuevos valores) al sacarlos de la pila::
+
+   function pop_registers_from_stack() is
+      foreach register in reverse(registers)
+         pop()
+
 Una vez hecho esto, basta marcar (de forma conservativa) los *stacks* de todos
 los threads para terminar de marcar el *root set*::
 
@@ -660,9 +678,9 @@ objetos grandes se marcan todas las pÃ¡ginas que utilizaban como ``FREE``::
    function free_big_object(pool, page) is
       pool_end = cast(byte*) pool.pages + (PAGE_SIZE * pool.number_of_pages)
       do
-         page = cast(byte*) page + PAGE_SIZE
          page.block_size = FREE
-      while page.block_size is CONTINUATION and page < pool_end
+         page = cast(byte*) page + PAGE_SIZE
+      while page < pool_end and page.block_size is CONTINUATION
 
 AdemÃ¡s, los bloques que tienen en atributo ``final`` son finalizados llamando
 a la funciÃ³n ``finalize()``. Esta funciÃ³n es un servicio que provee la
@@ -741,16 +759,15 @@ suficientemente grande como para poder almacenar el tamaÃ±o solicitado). Una
 vez mÃ¡s el algoritmo distingue objetos grandes de pequeÃ±os. Los pequeÃ±os se
 asignan de las siguiente manera::
 
-      function new_small(block_size) is
+   function new_small(block_size) is
+      block = find_block_with_size(block_size)
+      if block is null
+         collect()
          block = find_block_with_size(block_size)
          if block is null
-            collect()
+            new_pool()
             block = find_block_with_size(block_size)
-            if block is null
-               new_pool()
-               block = find_block_with_size(block_size)
-               return null
-         return block
+      return block
 
 Se intenta reiteradas veces conseguir un bloque del tamaÃ±o correcto libre,
 realizando diferentes acciones si no se tiene Ã©xito. Primero se intenta hacer
@@ -760,39 +777,41 @@ pidiendo memoria al *low level allocator* (el sistema operativo generalmente).
 
 Para intentar buscar un bloque de memoria libre se realiza lo siguiente::
 
-      function find_block_with_size(block_size) is
+   function find_block_with_size(block_size) is
+      block = free_lists[block_size].pop_first()
+      if block is null
+         assign_page(block_size)
          block = free_lists[block_size].pop_first()
-         if block is null
-            assign_page(block_size)
-            block = free_lists[block_size].pop_first()
-         return block
+      return block
 
 Si no se puede obtener un bloque de la lista de libres correspondiente, se
 busca asignar una pÃ¡gina libre al tamaÃ±o de bloque deseado de forma de
 *alimentar* la lista de libres con dicho tamaÃ±o::
 
-      function assign_page(block_size) is
-         foreach pool in heap
-            foreach page in pool
-               if page.block_size is FREE
-                  page.block_size = block_size
-                  foreach block in page
-                     free_lists[page.block_size].link(block)
+   function assign_page(block_size) is
+      foreach pool in heap
+         foreach page in pool
+            if page.block_size is FREE
+               page.block_size = block_size
+               foreach block in page
+                  free_lists[page.block_size].link(block)
 
 Cuando todo ello falla, el Ãºltimo recurso consiste en pedir memoria al sistema
 operativo, creando un nuevo *pool*::
 
-      funciones new_pool(number_of_pages = 1) is
-         pool = alloc(pool.sizeof)
-         if pool is null
-            return null
-         pool.number_of_pages = number_of_pages
-         pool.pages = alloc(number_of_pages * PAGE_SIZE)
-         if pool.pages is null
-            free(pool)
-            return null
-         heap.add(pool)
-         return pool
+   function new_pool(number_of_pages = 1) is
+      pool = alloc(pool.sizeof)
+      if pool is null
+         return null
+      pool.number_of_pages = number_of_pages
+      pool.pages = alloc(number_of_pages * PAGE_SIZE)
+      if pool.pages is null
+         free(pool)
+         return null
+      heap.add(pool)
+      foreach page in pool
+         page.block_size = FREE
+      return pool
 
 Se recuerda que la funciÃ³n ``alloc()`` es un :ref:`servicio
 <gc_intro_services>` provisto por el *low level allocator* y en la
@@ -808,22 +827,22 @@ Si el tamaÃ±o de bloque necesario para cumplir con la asignaciÃ³n de memoria es
 de una pÃ¡gina, entonces se utiliza otro algoritmo para alocar un objeto
 grande::
 
-      function new_big(size) is
-         number_of_pages = ceil(size / PAGE_SIZE)
+   function new_big(size) is
+      number_of_pages = ceil(size / PAGE_SIZE)
+      pages = find_pages(number_of_pages)
+      if pages is null
+         collect()
          pages = find_pages(number_of_pages)
          if pages is null
-            collect()
-            pages = find_pages(number_of_pages)
-            if pages is null
-               minimize()
-               pool = new_pool(number_of_pages)
-               if pool is null
-                  return null
-               pages = assign_pages(pool, number_of_pages)
-         pages[0].block_size = PAGE
-         foreach page in pages[1..end]
-            page.block_size = CONTINUATION
-         return pages[0]
+            minimize()
+            pool = new_pool(number_of_pages)
+            if pool is null
+               return null
+            pages = assign_pages(pool, number_of_pages)
+      pages[0].block_size = PAGE
+      foreach page in pages[1..end]
+         page.block_size = CONTINUATION
+      return pages[0]
 
 De forma similar a la asignaciÃ³n de objetos pequeÃ±os, se intenta encontrar una
 serie de pÃ¡ginas contiguas, dentro de un mismo *pool*, suficientes para
@@ -835,9 +854,9 @@ siguiente funciÃ³n, que devuelve al *low level allocator* los *pools*
 completamente libres::
 
    function minimize() is
-      for pool in heap
+      foreach pool in heap
          all_free = true
-         for page in pool
+         foreach page in pool
             if page.block_size is not FREE
                all_free = false
                break
@@ -849,34 +868,34 @@ completamente libres::
 Volviendo a la funciÃ³n ``new_big()``, para hallar una serie de pÃ¡ginas
 contiguas se utiliza el siguiente algoritmo::
 
-      function find_pages(number_of_pages) is
-         foreach pool in heap
-            pages = assign_pages(pool, number_of_pages)
-            if pages
-               return pages
-         return null
+   function find_pages(number_of_pages) is
+      foreach pool in heap
+         pages = assign_pages(pool, number_of_pages)
+         if pages
+            return pages
+      return null
 
 Como se dijo, las pÃ¡ginas deben estar contenidas en un mismo *pool* (para
 tener la garantÃ­a de que sean contiguas), por lo tanto se busca *pool* por
 *pool* dicha cantidad de pÃ¡ginas libres consecutivas a travÃ©s del siguiente
 algoritmo::
 
-      function assign_pages(pool, number_of_pages) is
-         pages_found = 0
-         first_page = null
-         foreach page in pool
-            if page.block_size is FREE
-               if pages_found is 0
-                  pages_found = 1
-                  first_page = page
-               else
-                  pages_found = pages_found + 1
-               if pages_found is number_of_pages
-                  return [first_page .. page]
+   function assign_pages(pool, number_of_pages) is
+      pages_found = 0
+      first_page = null
+      foreach page in pool
+         if page.block_size is FREE
+            if pages_found is 0
+               pages_found = 1
+               first_page = page
             else
-               pages_found = 0
-               first_page = null
-         return null
+               pages_found = pages_found + 1
+            if pages_found is number_of_pages
+               return [first_page .. page]
+         else
+            pages_found = 0
+            first_page = null
+      return null
 
 Una vez mÃ¡s, cuando todo ello falla (incluso luego de una recolecciÃ³n), se
 intenta alocar un nuevo *pool*, esta vez con una cantidad de pÃ¡ginas
@@ -1039,6 +1058,28 @@ C ``malloc()``, ``realloc()`` y ``free()`` directamente.
 La estructura ``Pool`` estÃ¡ compuesta por los siguientes atributos (ver figura
 :vref:`fig:dgc-pool`):
 
+.. fig:: fig:dgc-pool
+
+   Vista grÃ¡fica de la estructura de un *pool* de memoria.
+
+   .. aafig::
+      :scale: 120
+
+                /---  "baseAddr"    "ncommitted = i"          "topAddr" ---\
+                |                       V                                  |
+                |/                      |/                                 |/
+                +----  "committed" -----+-------  "no committed" ----------+
+               /|                      /|                                 /|
+                V                       V                                  V
+                +--------+--------+-----+--------+-----+-------------------+
+        pÃ¡ginas |   0    |   0    | ... |   i    | ... |    "npages - 1"   |
+                +--------+--------+-----+--------+-----+-------------------+
+                    A        A      A       A      A           A
+                    |        |      |       |      |           |
+                +--------+--------+-----+--------+-----+-------------------+
+      pagetable | Bins 0 | Bins 1 | ... | Bins i | ... | "Bins (npages-1)" |
+                +--------+--------+-----+--------+-----+-------------------+
+
 *baseAddr* y *topAddr*
    punteros al comienzo y fin de la memoria que almacena todas las pÃ¡ginas del
    *pool* (*baseAddr* es anÃ¡logo al atributo *pages* utilizado en las
@@ -1069,28 +1110,6 @@ La estructura ``Pool`` estÃ¡ compuesta por los siguientes atributos (ver figura
    ``B_UNCOMMITTED`` (valor que tienen las pÃ¡ginas que no fueron encomendadas
    aÃºn) y ``B_FREE``.
 
-.. fig:: fig:dgc-pool
-
-   Vista grÃ¡fica de la estructura de un *pool* de memoria.
-
-   .. aafig::
-      :scale: 120
-
-                /---  "baseAddr"    "ncommitted = i"          "topAddr" ---\
-                |                       V                                  |
-                |/                      |/                                 |/
-                +----  "committed" -----+-------  "no committed" ----------+
-               /|                      /|                                 /|
-                V                       V                                  V
-                +--------+--------+-----+--------+-----+-------------------+
-        pÃ¡ginas |   0    |   0    | ... |   i    | ... |    "npages - 1"   |
-                +--------+--------+-----+--------+-----+-------------------+
-                    A        A      A       A      A           A
-                    |        |      |       |      |           |
-                +--------+--------+-----+--------+-----+-------------------+
-      pagetable | Bins 0 | Bins 1 | ... | Bins i | ... | "Bins (npages-1)" |
-                +--------+--------+-----+--------+-----+-------------------+
-
 Como se observa, ademÃ¡s de la informaciÃ³n particular del *pool* se almacena
 toda la informaciÃ³n de pÃ¡ginas y bloques enteramente en el *pool* tambiÃ©n.
 Esto simplifica el manejo de que lo es memoria *pura* del *heap*, ya que queda
@@ -1312,6 +1331,8 @@ a ningÃºn destructor), para el usuario puede ser una garantÃ­a muy dÃ©bil
 y proveer finalizaciÃ³n asegurada puede ser muy deseable.
 
 
+.. _dgc_committed:
+
 Memoria *encomendada*
 ^^^^^^^^^^^^^^^^^^^^^
 El algoritmo actual divide un *pool* en dos Ã¡reas: memoria *encomendada*
@@ -1416,6 +1437,73 @@ utiliza conjuntos de bits. Esto trae dos ventajas principales:
   considerablemente la fase de marcado.
 
 
+.. _dgc_debug:
+
+Herramientas para depuraciÃ³n
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+
+El recolector provee algunas opciones para simplificar el diagnÃ³stico
+y depuraciÃ³n de problemas, tanto del mismo recolector como del programa del
+usuario.
+
+Las opciones mÃ¡s importantes son:
+
+
+``MEMSTOMP``
+   Su funciÃ³n es escribir un patrÃ³n determinado de bits en todos los bytes de
+   un bloque de memoria segÃºn se haya:
+
+   * Pedido un bloque menor a una pÃ¡gina (``0xF0``).
+   * Pedido un bloque mayor a una pÃ¡gina (``0xF1``).
+   * Dejado de usar debido a un pedido de achicamiento de un bloque
+     (``0xF2``).
+   * Pedido mÃ¡s pÃ¡ginas debido a un pedido de agrandamiento de un bloque
+     (``0xF0``).
+   * Liberado intencionalmente por el usuario (``0xF2``).
+   * Barrido (``0xF3``).
+
+   Esto permite al diagnosticar un problema saber, por ejemplo, si un
+   determinado Ã¡rea de memoria fue recolectada recientemente, o liberada por
+   el usuario, o reciÃ©n adquirida, etc. con tan solo ver si un patrÃ³n de bits
+   determinado estÃ¡ presente. Por supuesto puede existir *falsos positivos*
+   pero su probabilidad es lo suficientemente baja como para que sea Ãºtil en
+   la prÃ¡ctica.
+
+``SENTINEL``
+   Su funciÃ³n detectar errores producidos por escribir mÃ¡s allÃ¡ (o antes) del
+   Ã¡rea de memoria solicitada y estÃ¡ implementado reservando un poco mÃ¡s de
+   memoria de la que pide el usuario, devolviendo un puntero a un bloque
+   ubicado dentro del bloque real reservado (en vez de al inicio) y finalmente
+   escribiendo un patrÃ³n de bits en los extremos del borde real (ver figura
+   :vref:`fig:sentinel`), de forma de poder verificar en distintas situaciÃ³n
+   (por ejemplo al barrer el bloque) que esas Ã¡reas de mÃ¡s con los patrones de
+   bits estÃ©n intactas. Esto permite detectar de forma temprana errores tanto
+   en el recolector como en el programa del usuario.
+
+   .. fig:: fig:sentinel
+
+      Esquema de un bloque cuando estÃ¡ activada la opciÃ³n ``SENTINEL``.
+
+      .. aafig::
+         :textual:
+
+         |              |              |                              |        |
+         +-- Palabra ---+-- Palabra ---+-- TamaÃ±o bloque de usuario --+- Byte -+
+         |              |              |                              |        |
+
+         +--------------+--------------+------------------------------+--------+
+         | "TamaÃ±o del" |     Pre      |                              |  Post  |
+         |  "bloque de" |              |      Bloque de usuario       |        |
+         |   "usuario"  |  0xF4F4F4F4  |                              |  0xF5  |
+         +--------------+--------------+------------------------------+--------+
+                                       A
+                                       |
+                   Puntero devuleto ---/
+
+Ambas opciones son seleccionables sÃ³lo en tiempo de compilaciÃ³n del
+recolector, por lo que su utilidad real, al menos para el usuario, se ve
+severamente reducida.
+
 
 .. _dgc_bad:
 
@@ -1429,6 +1517,8 @@ participaciÃ³n y observaciÃ³n del grupo de noticias, de donde se obtuvieron los
 principales problemas percibidos por la comunidad que utiliza el lenguaje.
 
 
+.. _dgc_bad_code:
+
 Complejidad del cÃ³digo y documentaciÃ³n
 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
 El anÃ¡lisis del cÃ³digo fue muy complicado debido a la falta de documentaciÃ³n
@@ -1443,6 +1533,8 @@ recolector actual y en consecuencia sea muy complicado escribir documentaciÃ³n
 o mejorarlo. Esto a su vez provoca que, al no disponer de una implementaciÃ³n
 de referencia sencilla, sea muy difÃ­cil implementar un recolector nuevo.
 
+.. highlight:: d
+
 Este es, probablemente, la raÃ­z de todos los demÃ¡s problemas del recolector
 actual. Para ilustrar la dimensiÃ³n del problema se presenta la implementaciÃ³n
 real de la funciÃ³n ``bigAlloc()``::
@@ -1655,6 +1747,37 @@ bits para la fase de marcado, el resto del algoritmo es casi la versiÃ³n mÃ¡s
 bÃ¡sica de marcado y barrido. Hay mucho lugar para mejoras en este sentido.
 
 
+Configurabilidad
+^^^^^^^^^^^^^^^^
+Si bien el recolector actual tiene algunas caracterÃ­sticas configurables,
+todas son seleccionables sÃ³lo en tiempo de compilaciÃ³n del recolector (no del
+programa del usuario), como por ejemplo las opciones descriptas en
+:ref:`dgc_debug`. Por lo tanto, a nivel prÃ¡ctico, es como si no tuviera
+posibilidad alguna de ser configurado por el usuario, ya que no es parte del
+ciclo de desarrollo normal el recompilar el recolector o *runtime* de un
+lenguaje.
+
+Dado que es imposible que un recolector sea Ã³ptimo para todo tipo de
+programas, es muy deseable permitir una configuraciÃ³n de parÃ¡metros del
+recolector que permitan al usuario ajustarlo a las necesidades particulares de
+sus programas.
+
+
+.. _dgc_bad_ocup:
+
+Factor de ocupaciÃ³n del *heap*
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Otro problema potencialmente importante del recolector actual es que no se
+tiene ningÃºn cuidado con respecto a que, luego de una recolecciÃ³n, se haya
+recuperado una buena parte del *heap*. Por lo tanto, en casos extremos, el
+recolector tiene que hacer una recolecciÃ³n por cada peticiÃ³n de memoria, lo
+que es extremadamente ineficiente.
+
+Para evitar esto, habrÃ­a que usar algÃºn esquema para evaluar cuando una
+recolecciÃ³n no fue lo suficientemente *exitosa* y en ese caso pedir mÃ¡s
+memoria al sistema operativo.
+
+
 Detalles
 ^^^^^^^^
 Finalmente hay varios detalles en la implementaciÃ³n actual que podrÃ­an
@@ -1702,6 +1825,304 @@ Marcado iterativo
    *heap*.
 
 
+
+.. Esto serÃ­a muy similar a la secciÃ³n de "RecolecciÃ³n de basura) pero en
+   vez de ir describiendo los algoritmos irÃ­a comentando por quÃ© los tomo
+   o descarto
+   ESTADO: INCOMPLETO
+
+
+.. _dgc_via:
+
+AnÃ¡lisis de viabilidad
+----------------------------------------------------------------------------
+
+Ya conociendo el lenguaje de programaciÃ³n D_ (con sus necesidades
+particulares), el estado del arte en recolecciÃ³n de basura  y el recolector
+actual de D_ es posible evaluar la viabilidad de los distintos algoritmos
+vistos en el capÃ­tulo :ref:`gc`. Se recuerda que dentro del anÃ¡lisis de
+viabilidad de considera de gran importancia la viabilidad social y polÃ­tica de
+la mejora, es decir, se presta particular atenciÃ³n en encontrar una mejora que
+tenga una buena probabilidad de ser aceptada por la comunidad de D_.
+
+
+.. _dgc_via_classic:
+
+Algoritmos clÃ¡sicos
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+En esta secciÃ³n se presenta un anÃ¡lisis de los :ref:`algoritmos clÃ¡sicos
+<gc_classic>`, de forma de poder analizar a grandes rasgos las principales
+familias para ir determinando la direcciÃ³n principal de la soluciÃ³n.
+
+
+.. _dgc_via_rc:
+
+Conteo de referencias
+^^^^^^^^^^^^^^^^^^^^^
+Ya se ha propuesto en el pasado la utilizaciÃ³n de conteo de referencias en D_
+pero no se ha demostrado un interÃ©s real, mÃ¡s allÃ¡ de soluciones en
+bibliotecas [NGD38689]_. Las razones para no utilizar conteo de referencia son
+mÃ¡s o menos las mismas que las desventajas mencionadas en la secciÃ³n
+:ref:`gc_rc` (en el capÃ­tulo :ref:`gc`), siendo la principal la incapacidad de
+recolectar ciclos. Sin embargo hay otras razones importantes.
+
+Una de ellas es la inter-operatividad con C. El utilizar un contador de
+referencias requiere la manipulaciÃ³n del contador por parte del cÃ³digo C con
+el que se interactÃºe. Si bien este problema ya estÃ¡ presente si cÃ³digo
+C guarda un puntero a un objeto almacenado en el *heap* del recolector de D_
+en el *heap* de C (es decir, en una celda de memoria asignada por
+``malloc()``), esto es poco comÃºn. Sin embargo, mientras que una funciÃ³n de
+C se estÃ¡ ejecutando, es extremadamente comÃºn que pueda almacenar en el
+*stack* una referencia a un objeto de D_ y en ese caso el recolector actual
+puede manejarlo (mientras la funciÃ³n de C estÃ© corriendo en un hilo creado por
+D_). Sin embargo al usar un conteo de referencias esto es mÃ¡s problemÃ¡tico, ya
+que no se mantiene la invariante del algoritmo si no son actualizados siempre
+los contadores.
+
+Otro problema es que al liberarse una celda, existe la posibilidad de tener
+que liberar todo el sub-grafo conectado a Ã©sta. Cuando este sub-grafo es
+grande, se puede observar una gran pausa.
+
+Si bien estas razones son suficientes como para considerar que el conteo de
+referencias no es un algoritmo que sea viable en D_, hay muchas tÃ©cnicas
+y optimizaciones para minimizarlas (como liberaciÃ³n perezosa, conteo de
+referencias pospuesto, etc. [JOLI96]_). Sin embargo hay otra razÃ³n importante
+que descarta esta familia de algoritmos ya que todas las variaciones de conteo
+de referencias implican, en mayor o menor medida, el entrelazado del trabajo
+del recolector con el del *mutator*. Si bien esta es una caracterÃ­stica en
+general muy deseable (porque hace que el recolector sea :ref:`incremental
+<gc_inc>`), en D_ no lo es porque tiene como requerimiento no hacer pagar el
+precio de cosas que no se usan. En D_ debe ser posible no utilizar el
+recolector de basura y, al no hacerlo, no tener ningÃºn tipo de trabajo extra
+asociado a Ã©ste. De usarse conteo de referencias esto no serÃ­a posible.
+
+Si bien este requerimiento puede ser discutible tÃ©cnicamente, hay una gran
+resistencia social y polÃ­tica ante cualquier tipo de recolector que imponga
+una penalizaciÃ³n de rendimiento a alguien que no quiera usarlo [NGD38689]_.
+AdemÃ¡s requiere un cambio complejo y profundo en el compilador, siendo Ã©ste
+uno de los eslabones con mayor resistencia a introducir cambios.
+
+Por lo tanto se concluye que el conteo de referencias no es un algoritmo
+viable para este trabajo.
+
+
+.. _dgc_via_mark_sweep:
+
+Marcado y barrido
+^^^^^^^^^^^^^^^^^
+El marcado y barrido es un algoritmo evidentemente viable debido a que es la
+base del algoritmo del recolector de basura actual.
+
+En general en la comunidad de D_ no hay mayores crÃ­ticas al marcado y barrido
+en sÃ­, si no mÃ¡s bien a problemas asociados a la implementaciÃ³n actual,
+principalmente a las grandes pausas o la falta de :ref:`precisiÃ³n
+<gc_conserv>` [NGD54084]_ [NGL13744]_ [NGD44607]_ [NGD29291]_ [NGDN87831]_
+[NGDN87831]_ [NGL3937]_ [NGD22968]_ [NGA15246]_ [NGD5622]_ [NGD2547]_
+[NGD18354]_.
+
+Esta familia de algoritmos se adapta bien a los requerimientos principales de
+D_ en cuanto a recolecciÃ³n de basura (ver :ref:`dgc_needs`), por ejemplo
+permite recolectar de forma conservativa, no impone un *overhead* a menos que
+se utilice el recolector, permite liberar memoria manualmente, se adapta de
+forma simple para soportar punteros *interiores* y permite finalizar objetos
+(con las limitaciones mencionadas en :ref:`dgc_prob_final`).
+
+Sin embargo muchas de las limitaciones del recolector actual (ver
+:ref:`dgc_bad`), no son inherentes al marcado y barrido, por lo que aÃºn
+conservando la base del algoritmo, es posible realizar una cantidad de mejoras
+considerable.
+
+Una de las principales mejoras que pueden realizarse es hacer al recolector
+:ref:`concurrente <gc_concurrent>` y parcialmente mÃ¡s :ref:`preciso
+<gc_conserv>`. Estas dos mejoras solamente alcanzarÃ­an para mejorar de forma
+notable el tiempo de pausa en las recolecciones y la cantidad de memoria
+retenida debido a falsos positivos.
+
+MÃ¡s adelante veremos detalles sobre algunos de estos aspectos y sobre algunos
+algoritmos particulares que permiten hacer concurrente al recolector actual.
+
+
+Copia de semi-espacio
+^^^^^^^^^^^^^^^^^^^^^
+La copia de semi-espacio, al igual que cualquier otro tipo de recolector con
+movimiento, requiere (en la mayorÃ­a de los casos) disponer de una
+:ref:`precisiÃ³n <gc_conserv>` casi completa. Las celdas para las cuales hay
+alguna referencia que no es precisa no pueden ser movidas, ya que al no estar
+seguros que la referencia sea tal, Ã©sta no puede ser actualizada con la
+direcciÃ³n de la nueva ubicaciÃ³n de la celda movida porque de no ser una
+referencia se estarÃ­an alterando datos del usuario, corrompiÃ©ndolos.
+
+Es por esto que si el recolector no es mayormente preciso, las celdas que
+pueden ser movidas son muy pocas y, por lo tanto, se pierden las principales
+ventajas de esta familia de recolectores (como la capacidad de asignar nueva
+memoria mediante *pointer bump allocation*).
+
+Este aumento de precisiÃ³n, sin embargo, es bastante realizable. Es posible, en
+teorÃ­a, hacer que al menos el *heap* sea preciso, aunque es discutible si en
+la prÃ¡ctica es aceptable el *overhead* en espacio necesario para almacenar la
+informaciÃ³n del tipo de una celda. Esto se analiza en mÃ¡s detalle al evaluar
+la recolecciÃ³n precisa en la siguiente secciÃ³n.
+
+Si bien las principales herramientas para que sea viable un recolector por
+copia de semi-espacio estÃ¡n disponibles en D_ (como la posibilidad de hacer
+*pinning* the celdas o el potencial incremento de precisiÃ³n), este lenguaje
+nunca va a poder proveer precisiÃ³n total, haciendo que no sea posible
+implementar un recolector por copia de semi-espacio puro. Siempre habrÃ¡ que
+disponer un esquema hÃ­brido para poder manejar las celdas que no puedan
+moverse, incrementado mucho la complejidad del recolector.
+
+Si bien un esquema hÃ­brido es algo tÃ©cnicamente posible, nuevamente la
+resistencia social a un cambio de esta envergadura es de importancia
+suficiente como para inclinarse por una soluciÃ³n menos drÃ¡stica.
+
+
+.. _dgc_via_art:
+
+Principales categorÃ­as del estado del arte
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+En esta secciÃ³n se realiza un anÃ¡lisis de la viabilidad de las principales
+categorÃ­as de recolectores segÃºn se presentaron en la secciÃ³n :ref:`gc_art`.
+
+RecolecciÃ³n directa / indirecta
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Como se ha visto al analizar el conteo de referencias, lo mÃ¡s apropiado para
+D_ pareciera ser continuar con el esquema de recolecciÃ³n indirecta, de forma
+tal de que el precio de la recolecciÃ³n solo deba ser pagado cuando el
+*mutator* realmente necesita del recolector. Es por esto que no parece ser una
+opciÃ³n viable introducir recolecciÃ³n directa en este trabajo.
+
+
+RecolecciÃ³n incremental
+^^^^^^^^^^^^^^^^^^^^^^^
+La recolecciÃ³n incremental puede ser beneficiosa para D_, dado que puede
+servir para disminuir el tiempo de pausa del recolector. Sin embargo, en
+general es necesario instrumentar el *mutator* para reportar cambios en el
+grafo del conectividad al recolector. AdemÃ¡s puede contar con los mismos
+problemas que la recolecciÃ³n directa, puede hacer que el usuario tenga que
+pagar el precio de la recolecciÃ³n, incluso cuando no la necesita, si por cada
+asignaciÃ³n el recolector realiza parte de una recolecciÃ³n que no fue
+solicitada.
+
+RecolecciÃ³n concurrente / paralela / *stop-the-world*
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+El recolector actual es *stop-the-world*, sin embargo esta es una de las
+principales crÃ­ticas que tiene. El recolector se podrÃ­a ver beneficiado de
+recolecciÃ³n paralela, tanto para realizar la recolecciÃ³n mÃ¡s velozmente en
+ambientes multi-procesador, como para disminuir el tiempo de pausa. Sin
+embargo, el hecho de que todos los hilos se pausen para realizar parte del
+trabajo del recolector puede ser contraproducente para programas *real-time*
+que pretendan usar un hilo que no sufra de la latencia del recolector,
+asegurando que nunca lo use (aunque se podrÃ­an ver esquemas para ajustarse
+a estas necesidades).
+
+En general los recolectores concurrentes necesitan tambiÃ©n instrumentar el
+*mutator* para reportar cambios en el grafo de conectividad al recolector,
+como sucede con la recolecciÃ³n directa o incremental, sin embargo hay
+algoritmos que no tienen este requerimiento, utilizando servicios del sistema
+operativo para tener una *fotografÃ­a* de la memoria para que la fase de
+marcado pueda realizarse sin perturbar al *mutator* ni requerir de su
+cooperaciÃ³n [RODR97]_. Este tipo de algoritmos serÃ­an un buen candidato para
+D_, dado que requiere pocos cambios y es transparente al *mutator*.
+
+
+RecolecciÃ³n conservativa / precisa
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Si bien D_ puede proveer al recolector de basura informaciÃ³n de tipos para los
+objetos almacenados en el *heap*, todo recolector para D_ deberÃ¡ soportar
+cierto grado de recolecciÃ³n conservativa (ver :ref:`gc_conserv`), debido a las
+siguientes razones:
+
+* Si bien D_ podrÃ­a incorporar informaciÃ³n de tipos para el *stack*
+  (utilizando, por ejemplo, la tÃ©cnica de *shadow stack* [HEND02]_), para
+  poder interactuar con C/C++, el recolector debe poder interpretar los *stack
+  frames* [#dgcstackframe]_ de estos lenguajes, que no disponen de informaciÃ³n
+  de tipos.
+
+* Los registros del procesador tienen un problema similar, con la diferencia
+  de que el costo de implementar algo similar a *shadow stack* para los
+  registros serÃ­a impracticable, mÃ¡s allÃ¡ de que exista la misma limitaciÃ³n
+  que con el *stack* para poder interactuar con C/C++.
+
+* D_ soporta uniones (ver :ref:`d_low_level`). Para una uniÃ³n es imposible
+  determinar si un campo es un puntero o no. Por ejemplo::
+
+      union U {
+         size_t x;
+         void* p;
+      }
+
+  AquÃ­ el recolector no puede saber nunca si el valor almacenado serÃ¡ un
+  ``size_t`` o un ``void*``, por lo tanto deberÃ¡ tratar **siempre** esa
+  palabra de forma conservativa (es decir, interpretarla como un *posible*
+  puntero). Este requerimiento puede ser relajado si el usuario proveyera
+  alguna forma de determinar que tipo estÃ¡ almacenando la uniÃ³n en un
+  determinado momento. Sin embargo el costo de pedir al usuario este tipo de
+  restricciÃ³n puede ser muy alto.
+
+Sin embargo, ya hay un trabajo relacionado avanzando en este sentido, que
+agrega precisiÃ³n al marcado del *heap*. David Simcha comienza con este trabajo
+explorando la posibilidad de agregar precisiÃ³n parcial al recolector,
+generando informaciÃ³n sobre la ubicaciÃ³n de los punteros para cada tipo
+[DBZ3463]_. Su trabajo se limita a una implementaciÃ³n a nivel biblioteca de
+usuario y sobre `D 2.0`_.  Desafortunadamente su trabajo pasa desapercibido
+por un buen tiempo.
+
+Sin embargo un tiempo despuÃ©s Vincent Lang (mejor conocido como *wm4* en la
+comunidad de D_), retoma este trabajo, pero modificando el compilador DMD_
+y trabajando con `D 1.0`_ y Tango_. Es por esto que el aumento de precisiÃ³n
+parece ser un Ã¡rea fÃ©rtil para este trabajo, en particular si se colabora con
+el trabajo realizado por David y Vincent.
+
+.. [#dgcstackframe] Un *stack frame* (*marco de la pila* en castellano),
+   tambiÃ©n conocido como *activation record* (o *registro de activaciÃ³n* en
+   castellano) es una estructura de datos dependiente de la arquitectura que
+   contiene informaciÃ³n del estado de una funciÃ³n, incluyendo, por ejemplo,
+   sus variables locales, parÃ¡metros y direcciÃ³n de retorno.
+
+
+RecolecciÃ³n con movimiento de celdas
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Esta posibilidad ya se ha discutido al analizar la posibilidad de utilizar
+recolecciÃ³n con copia de semi-espacios. El trabajo mencionado en la sub-secciÃ³n
+anterior agrega informaciÃ³n suficiente como poder diferenciar que celdas se
+pueden mover y cuales no, sin embargo queda como incÃ³gnita quÃ© proporciÃ³n de
+celdas deben permanecer inmovilizadas como para evaluar si un cambio tan
+grande puede rendir frutos o no.
+
+A priori, pareciera que la relaciÃ³n cantidad y complejidad de cambios sobre
+beneficios potenciales no fuera muy favorable a esta mejora.
+
+
+Lista de libres / *pointer bump allocation*
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Como consecuencia de los puntos anteriores, no es tÃ©cnicamente posible
+realizar *pointer bump allocation* pura en D_. Al haber objetos *pinned*,
+siempre es necesario o bien contar con una lista de libres, o detectar
+*huecos* en un esquema de *pointer bump allocation*. Es por esto que parece
+ser mÃ¡s viable conservar el esquema de listas de libres.
+
+Esta mejora tambiÃ©n entra en la categorÃ­a de opciones viables pero cuya
+complejidad no parece valer la pena dada la limitada utilidad que se espera
+dadas las particulares caracterÃ­sticas de D_ en cuanto a precisiÃ³n de
+informaciÃ³n de tipos de *stack*, uniones, etc.
+
+
+RecolecciÃ³n por particiones / generacional
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Una vez mÃ¡s la recolecciÃ³n por particiones, en particular la generacional,
+requiere de la instrumentaciÃ³n del *mutator* para comunicar cambios en el
+grafo de conectividad al recolector, por lo que es poco viable. Aunque existen
+algoritmos que no necesitan este tipo de comunicaciÃ³n dado que estÃ¡
+garantizado que no existan conexiones entre celdas de las distintas
+particiones, requiere grandes cambios en el compilador y realizar anÃ¡lisis
+estÃ¡tico bastante complejo [HIRZ03]_. AdemÃ¡s al ser D_ un lenguaje de bajo
+nivel, es muy difÃ­cil garantizar que estas conexiones inter-particiones no
+puedan existir realmente; y de poder lograrlo, podrÃ­a ser demasiado
+restrictivo.
+
+
 .. include:: links.rst
 
 .. vim: set ts=3 sts=3 sw=3 et tw=78 spelllang=es :