X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/15b868186b7ca1853b52a34ace0865f1cc24c677..bfcf88d2417ab78f2d0da4cb6f7b00441c5b9bed:/source/conclusion.rst

diff --git a/source/conclusion.rst b/source/conclusion.rst
index 88b5cd1..7fc9e6b 100644
--- a/source/conclusion.rst
+++ b/source/conclusion.rst
@@ -2,7 +2,7 @@
 .. Se presentan las conclusiones del trabajo, comparando los resultados
    obtenidos con el punto de partida. Se mencionan puntos pendientes o
    nuevas lÃ­neas de investigaciÃ³n.
-   ESTADO: SIN EMPEZAR
+   ESTADO: TERMINADO
 
 
 .. _conclusion:
@@ -10,47 +10,442 @@
 ConclusiÃ³n
 ============================================================================
 
-TODO
+Durante el desarrollo de este trabajo se introdujo al lenguaje de programaciÃ³n
+D_ y a los conceptos bÃ¡sicos de recolecciÃ³n de basura. Luego se analizÃ³ el
+recolector de basura actual y se seÃ±alaron sus principales falencias,
+proponiendo un conjunto de modificaciones con el objeto de subsanarlas.
+Para evaluar los resultados de las modificaciones se construyÃ³ un banco de
+pruebas variado para poder analizar tanto aspectos particulares como el
+funcionamiento de programas reales; y se establecieron mÃ©tricas para
+cuantificar dichos resultados.
 
+El objetivo principal fue bajar la latencia del recolector, es decir el tiempo
+mÃ¡ximo de pausa real, y se pudo comprobar que, salvo en casos muy
+particulares, esto fue conseguido de manera contundente (con tiempos de pausa
+hasta 200 veces menores que el recolector original de D_). La inclusiÃ³n del
+marcado concurrente demostrÃ³ ser una aproximaciÃ³n correcta al problema.
+
+La aceptaciÃ³n de la soluciÃ³n por parte de la comunidad tambiÃ©n ha sido un
+objetivo importante de este trabajo, y si bien en este sentido sigue siendo un
+trabajo en curso, la recepciÃ³n ha sido ampliamente positiva por parte de la
+comunidad y se espera que el resultado de este trabajo sea incorporado en el
+corto plazo tanto a `D 1.0`_ a travÃ©s de Tango_, como a `D 2.0`_.
+
+AdemÃ¡s de los objetivos principales se cumplieron otros objetivos anexos, pero
+no por eso menos importantes. Para la aplicaciÃ³n real el tiempo total de
+ejecuciÃ³n se ha reducido hasta casi una tercera parte, y para otras
+aplicaciones pequeÃ±as se ha reducido mÃ¡s de 17 veces. Estos resultados han
+sido particularmente sorprendentes, siendo que la reducciÃ³n del tiempo total
+de ejecuciÃ³n no ha sido parte del objetivo principal y no se habÃ­an encontrado
+referencias en la bibliografÃ­a de casos similares (por el contrario, en
+general la baja de la latencia suele estar acompaÃ±ada de una suba en el tiempo
+total de ejecuciÃ³n).
+
+Se ha podido experimentar ademÃ¡s con el marcado preciso, otro de los problemas
+del recolector mÃ¡s presentes en la comunidad. Los resultados obtenidos son
+variados, encontrando casos donde se consigue una mejorÃ­a notoria y otros en
+donde la forma de almacenar la informaciÃ³n de tipos produce resultados poco
+satisfactorios.
+
+La mayor flexibilidad del recolector al ser configurable tambiÃ©n ha demostrado
+ser Ãºtil. Por un lado para este mismo trabajo, al permitir realizar mediciones
+sobre el mismo binario utilizando diferentes configuraciones. Por otro, la
+amplia gama de resultados dispares obtenidos son una buena muestra de que no
+existen *balas de plata*, y cada programa tiene necesidades particulares en
+cuanto a recolecciÃ³n de basura. Por lo tanto, distintos programas pueden verse
+beneficiados o perjudicados por diferentes configuraciones. Esto hace que la
+posibilidad de configurar el recolector en tiempo de inicializaciÃ³n sea
+particularmente ventajoso.
+
+Finalmente, algunas optimizaciones muy pequeÃ±as demostraron ser tambiÃ©n muy
+valiosas para algunos casos particulares, logrando reducciones en el tiempo
+total de ejecuciÃ³n de hasta 5 veces.
+
+
+
+.. _con_pending:
+
+Puntos pendientes, problemas y limitaciones
+----------------------------------------------------------------------------
+
+Si bien los objetivos de este trabajo han sido alcanzados con Ã©xito, hay
+varias pequeÃ±as mejoras que han quedado pendientes y algunos problemas
+y limitaciones conocidas. A continuaciÃ³n se describe cada una de ellos.
+
+* EmisiÃ³n de mensajes informativos para depuraciÃ³n.
+
+  Entre las herramientas de depuraciÃ³n que provee el recolector, no se ha
+  mencionado la posibilidad de emitir opcionalmente mensajes informativos para
+  ayudar a depurar tanto problemas en el recolector como en el programa que lo
+  usa. El recolector actual tiene esa posibilidad pero es elegible en tiempo de
+  compilaciÃ³n. En este trabajo se agregaron las opciones en tiempo de
+  inicializaciÃ³n ``log_file`` y ``verbose`` con el propÃ³sito de poder elegir un
+  archivo en donde guardar los mensajes informativos y el nivel de detalle de
+  dichos mensajes respectivamente, pero finalmente nunca se implementaron.
+
+* PredicciÃ³n para estimar cuando lanzar una recolecciÃ³n temprana.
+
+  Las recolecciones se lanzan de manera temprana segÃºn la opciÃ³n ``min_free``.
+  Una mejor aproximaciÃ³n podrÃ­a ser predecir cuando se va a agotar la memoria
+  libre de forma adaptativa, calculando la tasa de asignaciÃ³n de memoria
+  y el tiempo total que tomÃ³ la recolecciÃ³n. Esta estimaciÃ³n se podrÃ­a mejorar
+  guardando un historial de que tan acertada fue para recolecciones pasadas. La
+  predicciÃ³n ideal deberÃ­a ser capaz de:
+
+  * Evitar tiempos de pausa (es decir, que la recolecciÃ³n temprana termine antes
+    de que se agote la memoria libre).
+  * No realizar recolecciones innecesarias (es decir, no lanzar recolecciones
+    tempranas si el programa no estÃ¡ pidiendo memoria a una tasa suficientemente
+    alta).
+
+* ExplosiÃ³n del uso de memoria con creaciÃ³n ansiosa de *pools*.
+
+  Se ha observado que en situaciones muy particulares, al usar creaciÃ³n
+  ansiosa de *pools* (o *eager allocation*), el uso de memoria crece
+  desmesuradamente. Si bien este efecto se ve principalmente en las pruebas
+  sintetizadas con tal fin, algunos programas reales lo sufren tambiÃ©n, pero
+  en general se puede atenuar utilizando tambiÃ©n *early collection*.
+  Recordemos ademÃ¡s, que lo analizado es el consumo **mÃ¡ximo** de memoria, por
+  lo que una rÃ¡faga de pedidos de memoria podrÃ­a crear un pico, pero durante
+  la mayor parte del transcurso del programa el consumo de memoria podrÃ­a ser
+  mucho menor. Queda pendiente analizar los casos puntuales con alguna mÃ©trica
+  mÃ¡s detallada sobre el progreso del uso de memoria.
+
+  TambiÃ©n queda pendiente buscar alguna estimaciÃ³n de cuÃ¡ndo es conveniente
+  utilizar *eager allocation* de forma adaptativa, dado que en general se ve
+  que cuando explota el consumo de memoria, tambiÃ©n explota el tiempo de
+  pausa, lo que quita gran parte del sentido de usar *eager allocation* en
+  primer lugar. Estimando de alguna manera cuanto va a crecer el tiempo de
+  pausa debido a esta opciÃ³n, se podrÃ­a desactivar temporalmente cuando no
+  haya ganancia en el tiempo de pausa para evitar esta explosiÃ³n ante rÃ¡fagas
+  de pedidos de memoria.
+
+* ReestructuraciÃ³n y limpieza del cÃ³digo.
+
+  Si bien se han hecho muchas mejoras a nivel de estructura y limpieza de
+  cÃ³digo, ha quedado mucho pendiente. TodavÃ­a hay bastante repeticiÃ³n en el
+  cÃ³digo y se mantiene la arquitectura bÃ¡sica del recolector.
+
+* ExperimentaciÃ³n con la llamada al sistema :manpage:`clone(2)`.
+
+  Linux_ implementa la llamada al sistema :manpage:`fork(2)` a travÃ©s de otra de
+  mÃ¡s bajo nivel llamada :manpage:`clone(2)`. :manpage:`clone(2)` permite una
+  granularidad a la hora de indicar que partes del proceso deben ser copiadas al
+  hijo y cuales deben ser compartidas mucho mayor que :manpage:`fork(2)`. Por
+  ejemplo, se puede compartir toda la memoria del proceso, siendo este el
+  mecanismo por el cual Linux_ implementa los hilos. Para este trabajo podrÃ­a
+  ser beneficioso usar :manpage:`clone(2)` para evitar copiar otro tipo de
+  estructuras dado que el proceso
+  hijo, al correr solo la fase de marcado, nunca va a interferir el *mutator*.
+  Se podrÃ­a experimentar no copiando las siguientes estructuras, por ejemplo:
+
+  ``CLONE_FILES``
+     Tabla de descriptores de archivo.
+
+  ``CLONE_FS``
+     Tabla de sistemas de archivo montados.
+
+  ``CLONE_IO``
+     Contextos de entrada/salida.
+
+  ``CLONE_SIGHAND``
+     Tabla de manejadores de seÃ±ales.
+
+* Uso de memoria compartida.
+
+  Al realizar marcado concurrente, si el *mutator* usa memoria compartida entre
+  procesos que almacene punteros al *heap* podrÃ­a haber problemas, dado que la
+  fase de barrido no estarÃ­a trabajando con una *fotografÃ­a* de la memoria. El
+  grafo de conectividad podrÃ­a efectivamente cambiar mientras se corre la fase
+  de barrido y por lo tanto el algoritmo deja de ser correcto, existiendo la
+  posibilidad de que se reciclen celdas *vivas*.
+
+  Dado que el usuario debe registrar cualquier puntero que no sea parte de la
+  memoria estÃ¡tica, *stack* o *heap* del recolector como parte del *root set*,
+  se podrÃ­a agregar un parÃ¡metro extra a la funciÃ³n de registro que indique si
+  los punteros agregados residen en memoria compartida. De este modo, al momento
+  de hacer el :manpage:`fork(2)`, el recolector deberÃ­a realizar una copia de
+  esos punteros mientras todos los hilos estÃ¡n pausados para obtener
+  efectivamente una *fotografÃ­a* estable del *root set*.
+
+* CondiciÃ³n de carrera al utilizar :manpage:`fork(2)`.
+
+  Existe una condiciÃ³n de carrera si se lanzan hilos usando directamente las
+  llamadas al sistema operativo, es decir si no se lanzan a travÃ©s del soporte
+  de hilos de D_, si el hilo lanzado utiliza archivos con *buffer* de
+  C (``FILE*``). Esto se debe a la siguiente porciÃ³n de cÃ³digo (introducida por
+  el marcado concurrente)::
+
+     function collect() is
+        stop_the_world()
+        fflush(null) //    <-------------------------
+        child_pid = fork()
+        if child_pid is 0
+           mark_phase()
+           exit(0)
+        // proceso padre
+        start_the_world()
+        wait(child_pid)
+        sweep()
+
+  La llamada a :manpage:`fflush(3)` es necesaria para evitar que los archivos
+  con *buffer* escriban su contenido dos veces al dispositivo, ya que la llamada
+  a :manpage:`fork(2)` duplica el *buffer*, y si bien el archivo no se usa en el
+  proceso con la fase de marcado, la biblioteca estÃ¡ndar de C escribe todos los
+  *buffers* pendientes al terminar el proceso. Esto funciona para los hilos
+  registrados por D_ gracias a que :manpage:`fflush(3)` se llama cuando todos
+  los hilos estÃ¡n pausados, si no un hilo podrÃ­a escribir al *buffer* justo
+  despuÃ©s de llamar a :manpage:`fflush(3)` pero antes de llamar
+  a :manpage:`fflush(2)`. Es por esto que si hay hilos no registrados por D_ que
+  utilicen manejo de archivos con *buffer* de C, esta condiciÃ³n sÃ­ se puede dar
+  y se pueden observar contenidos duplicados en dichos archivos.
+
+  Esta condiciÃ³n de carrera no tiene una soluciÃ³n simple, pero es de esperarse
+  que no sea un problema real dado que no es un escenario comÃºn. Sin embargo
+  eventualmente deberÃ­a analizarse alguna soluciÃ³n mÃ¡s robusta.
+
+* Soporte de referencias dÃ©biles.
+
+  Tango_ 0.99.9 incluye soporte de referencias dÃ©biles. Si bien se incorporÃ³
+  el cÃ³digo para manejar las referencias dÃ©biles, se espera que no funcione
+  correctamente con CDGC (no se ha podido comprobar por la falta de programas
+  de prueba que lo utilicen). La razÃ³n es que el soporte de referencias
+  dÃ©biles de Tango_ 0.99.9 se basa en la premisa de que la fase de marcado
+  corre con todos los hilos pausados, sin embargo al utilizar marcado
+  concurrente, esto no es mÃ¡s cierto. Parecen haber soluciones viables a este
+  problema pero no se han analizado en profundidad aÃºn.
+
+* PÃ©rdida de rendimiento con respecto al recolector original.
+
+  Se ha observado tambiÃ©n que, al no utilizar algunas optimizaciones de CDGC
+  (como la mejora del factor de ocupaciÃ³n del *heap*), Ã©ste puede tener un
+  rendimiento bastante menor a TBGC. Si bien no se ha investigado en
+  profundidad las causas de esta pÃ©rdida de rendimiento, se han identificado
+  algunos factores que podrÃ­an ser determinantes.
+
+  Por un lado, se ha observado que la mayor parte del tiempo extra que utiliza
+  CDGC proviene de la fase de marcado, en particular de los cambios
+  introducidos por el marcado preciso. Si bien se puede desactivar el marcado
+  preciso, la lÃ³gico en tiempo de ejecuciÃ³n no cambia, por lo que se paga el
+  precio sin obtener los beneficios. Queda pendiente analizar en mÃ¡s detalle
+  las causas de esto y posibles optimizaciones para subsanarlo.
+
+  .. flt:: t:con-staticsize
+     :type: table
+
+     Aumento del tamaÃ±o de la memoria estÃ¡tica (bytes).
+
+     ======== ======== ======== =========== ===========
+     Programa TBGC     CDGC     CDGC-TBGC   CDGC/TBGC
+     ======== ======== ======== =========== ===========
+     bh       22208    27604    5396        1.243
+     bigarr   18820    24212    5392        1.287
+     bisort   19836    25232    5396        1.272
+     conalloc 25816    31208    5392        1.209
+     concpu   25816    31208    5392        1.209
+     dil      416900   422300   5400        1.013
+     em3d     20988    26380    5392        1.257
+     mcore    18564    23988    5424        1.292
+     rnddata  188940   194332   5392        1.029
+     sbtree   22196    27588    5392        1.243
+     split    24312    29736    5424        1.223
+     tree     18660    24084    5424        1.291
+     tsp      20772    26168    5396        1.260
+     voronoi  21184    26580    5396        1.255
+     ======== ======== ======== =========== ===========
+
+  AdemÃ¡s se ha observado un crecimiento importante en el tamaÃ±o del Ã¡rea de
+  memoria estÃ¡tica del programa. En el cuadro :vref:`t:con-staticsize` se
+  puede observar dicho crecimiento para cada uno de los programas del banco de
+  pruebas. Esto se debe a que el recolector original estÃ¡ escrito de una forma
+  muy primitiva, usando muy pocos tipos de datos definidos por el usuario,
+  mientras que CDGC utiliza varias mÃ¡s, incluyendo algunos parametrizados. D_
+  guarda la informaciÃ³n de tipos en el Ã¡rea de memoria estÃ¡tica y se genera
+  mucha informaciÃ³n por cada tipo. AdemÃ¡s no separa el Ã¡rea de memoria
+  estÃ¡tica que debe ser utilizada como parte del *root set* de la que no (no
+  hay necesidad de que la informaciÃ³n de tipos sea parte del *root set*). Esto
+  causa que por cada recolecciÃ³n, se tenga que visitar bastante mÃ¡s memoria y,
+  lo que es probablemente peor, que aumente la probabilidad de encontrar
+  *falsos punteros*, dado que este Ã¡rea de memoria se marca siempre de forma
+  conservativa.
+
+  Finalmente, en el cuadro :vref:`t:con-binsize` tambiÃ©n se puede observar un
+  incremento en el tamaÃ±o del binario, lo que puede ser otra causa de la
+  pÃ©rdida de rendimiento, dado que puede afectar a la localidad de referencia
+  del cachÃ©, por ejemplo.
+
+  .. flt:: t:con-binsize
+     :type: table
+
+     Aumento del tamaÃ±o del binario (bytes).
+
+     ======== ======== ======== =========== ===========
+     Programa TBGC     CDGC     CDGC-TBGC   CDGC/TBGC
+     ======== ======== ======== =========== ===========
+     bh       138060   159884   21824       1.158
+     bigarr   192004   213832   21828       1.114
+     bisort   115164   136988   21824       1.190
+     conalloc 149848   171676   21828       1.146
+     concpu   149848   171676   21828       1.146
+     dil      1859208  1881028  21820       1.012
+     em3d     116324   142248   25924       1.223
+     mcore    105748   127576   21828       1.206
+     rnddata  1492588  1518512  25924       1.017
+     sbtree   129860   155784   25924       1.200
+     split    144308   166136   21828       1.151
+     tree     105844   127672   21828       1.206
+     tsp      128412   150236   21824       1.170
+     voronoi  141112   162936   21824       1.155
+     ======== ======== ======== =========== ===========
 
 
 Trabajos relacionados
 ----------------------------------------------------------------------------
 
-TODO
+Dado que D_ no ha penetrado en Ã¡mbitos acadÃ©micos, se ha encontrado un solo
+trabajo de investigaciÃ³n relacionado. Sin embargo se ha encontrado otro
+trabajo que si bien no es formal, ha sido de mucha importancia para el
+desarrollo de este trabajo.
+
+A continuaciÃ³n se describen ambos.
+
+* *Memory Management in the D Programming Language* [PAN09]_.
+
+  Tesis de licenciatura de Vladimir Panteleev cuya resumen traducido es el
+  siguiente:
+
+      Este reporte describe el estudio de las tÃ©cnicas de manejo automÃ¡tico de
+      memoria, su implementaciÃ³n en el lenguaje de programaciÃ³n D_, y el
+      trabajo para mejorar el estado del manejo de memoria.
+
+  Si bien plantea pequeÃ±as optimizaciones para el recolector de basura
+  (algunas utilizadas en este trabajo), se centra principalmente en el
+  desarrollo de Diamond, una utilidad para depuraciÃ³n de manejo de memoria en
+  D_.
+
+* IntegraciÃ³n de marcado preciso del *heap* al recolector de basura
+  [DBZ3463]_.
+
+  Ya citado varias veces en este trabajo, fue comenzado por David Simcha
+  y publicado en el sistema de seguimiento de fallas de D_ que se limita a una
+  implementaciÃ³n a nivel biblioteca de usuario y sobre `D 2.0`_. Vincent Lang
+  (mejor conocido como *wm4* en la comunidad de D_) da continuidad a este
+  trabajo pero modificando el compilador DMD_ y trabajando con `D 1.0`_
+  y Tango_.
+
+  El soporte de marcado preciso presentado en este trabajo se basa en las
+  modificaciones hechas al compilador DMD_ por Vincent Lang (que aÃºn no fueron
+  integradas de forma oficial).
 
-* Diamond:
-  http://thecybershadow.net/d/Memory_Management_in_the_D_Programming_Language.pdf
 
 
 Trabajos futuros
 ----------------------------------------------------------------------------
 
-TODO
-
-* Cambiar el layout de memoria (mostrar lo encontrado en el post). Se podrÃ­a
-  usar un tamaÃ±o de bloque por cada tipo de dato (y por lo tanto una lista de
-  libres por cada tipo de dato). Esto podrÃ­a ahorrar muchos bits (mark,
-  freebits, scan, etc.), el puntero al pointer mask se guardarÃ­a una sola vez,
-  no hay ningÃºn desperdicio de espacio salvo algÃºn padding, pero podrÃ­an haber
-  esquemas donde ni siquiera (si siempre se alocan tantas pÃ¡ginas como sean
-  necesarias para evitar el padding para un tamaÃ±o de bloque). Un tipo de dato
-  NO_SCAN no alocarÃ­a directamente bits de noscan, mark y scan. Se podrÃ­a
-  tratar de forma especial a strings.
-* Lazy sweeping.
-* Concurrent sweeping (lanzar fase de sweep en un thread que no pertenezca al
-  mutator).
-* Continuous collection (lanzar un thread que estÃ© haciendo fullcollect() en
-  un loop). Lo bueno es que el sweep podrÃ­a correr en ese thread, bajando aÃºn
-  mÃ¡s el tiempo mÃ¡ximo de pausa (aunque esto se puede hacer mÃ¡s allÃ¡ de hacer
-  continuous collection, ver "concurrent sweeping"), lo malo es que tal vez se
-  estarÃ­a recolectando demasiado sin ninguna ganancia substancial.
-* Medir mejor cuando lanzar una recolecciÃ³n cuando se usa early collection
-  (por ejemplo medir la tasa de alocaciÃ³n y el tiempo de recolecciÃ³n y asÃ­
-  hallar el momento ideal para lanzar la recolecciÃ³n).
-* Emprolijar todavÃ­a mÃ¡s el cÃ³digo (o reescribirlo).
-* Hacer preciso el static data por el tema de los TypeInfo's que ocupan mucha
-  memoria que debe ser escaneada.
+En la secciÃ³n :ref:`con_pending` se mencionan varios aspectos de este trabajo
+que podrÃ­an verse beneficiados por trabajos futuros, sin embargo se trata en
+general de pequeÃ±as optimizaciones o mejoras de alcance muy limitado.
+
+A continuaciÃ³n se recopilan varios otros aspectos identificados durante el
+desarrollo del presente trabajo, pero que requieren un nivel de anÃ¡lisis
+y, potencialmente, de desarrollo mayor a los ya presentados en la secciÃ³n
+mencionada.
+
+* Mejoras en la organizaciÃ³n de memoria del recolector.
+
+  Si bien se ha mencionado en un principio la organizaciÃ³n actual como un
+  aspecto positivo del recolector, varios resultados han demostrado
+  deficiencias importantes. El nivel de espacio desperdiciado por la divisiÃ³n
+  de memoria en bloques puede ser muy significativa y la forma en la que se
+  almacena la informaciÃ³n de tipos para el marcado preciso puede incluso
+  acentuarlo todavÃ­a mÃ¡s (como se demuestra en los resultados para ``bh``
+  y ``dil``).
+
+  Este problema no solo afecta al consumo de memoria, ademÃ¡s genera un efecto
+  dominÃ³ por el incremento de la probabilidad de tener *falsos punteros*
+  y perjudica al tiempo total de ejecuciÃ³n por empeorar la localidad de
+  referencia del cachÃ© y por hacer que se prolongue la recolecciÃ³n de basura
+  por tener que marcar y barrer mÃ¡s memoria.
+
+  Una posible alternativa es tener una lista de libres por **tipo**, cuyo
+  tamaÃ±o de bloque sea exactamente igual al tamaÃ±o del tipo que almacena. La
+  informaciÃ³n de tipo se almacenarÃ­a entonces solo una vez y no habrÃ­a
+  desperdicio de memoria alguno dejando de lado un posible relleno para
+  completar una pÃ¡gina. Este esquema deberÃ­a tener algÃºn tipo de guarda para
+  programas con una cantidad exuberante de tipos de datos.
+
+  TambiÃ©n podrÃ­a ser conveniente separar los bloques marcados como ``NO_SCAN``
+  de los que sÃ­ deben ser marcados, de manera que no necesite almacenar
+  directamente los bits de ``mark`` , ``scan`` y ``noscan``. TambiÃ©n se podrÃ­a
+  proponer algÃºn Ã¡rea de memoria especial para almacenar cadenas de texto
+  (como un caso especial de lo anterior) por tener estas caracterÃ­sticas muy
+  particular (largos muy variables, cambian de tamaÃ±o de forma relativamente
+  frecuente, etc.). Las posibilidades son enormes.
+
+* Mejoras en la fase de barrido.
+
+  En este trabajo todas las mejoras propuestas se encargaron de la fase de
+  marcado, pero mucho se pude mejorar en la fase de barrido tambiÃ©n. Por un
+  lado se podrÃ­a agregar barrido perezoso para disminuir aÃºn mÃ¡s el tiempo de
+  pausa real. Se ha mostrado que en muchos casos los tiempos de pausa pueden
+  ser considerablemente altos debido a que la fase de barrido no se realiza en
+  paralelo como el marcado.
+
+  Otra forma de disminuir el tiempo de pausa real serÃ­a realizar un barrido
+  concurrente tambiÃ©n. Esto no puede realizarse en otro proceso porque el
+  barrido es el encargado de ejecutar los *finalizadores*, pero sÃ­ se podrÃ­a
+  barrer en otro hilo y, por ejemplo, seguir utilizando *eager allocation*
+  hasta que el barrido finalice.
+
+* Mejoras en la precisiÃ³n del marcado.
+
+  Como se mencionÃ³ anteriormente, el Ã¡rea de memoria estÃ¡tica se marca de
+  forma conservativa dada la falta de informaciÃ³n de tipos de Ã©sta. Sin
+  embargo es bastante razonable pensar en que el compilador genere informaciÃ³n
+  de tipos para el Ã¡rea de memoria estÃ¡tica o que al menos informe mejor al
+  recolector que partes deben ser consideradas parte del *root set* y cuales
+  no. Dado que la memoria estÃ¡tica crece de forma considerable con el
+  incremento de la cantidad de tipos definidos por el usuario, ya solo esa
+  divisiÃ³n puede hacer una diferencia importante; en especial considerando
+  como aumenta la memoria estÃ¡tica solamente por usar mÃ¡s tipos de datos en el
+  recolector.
+
+  TambiÃ©n podrÃ­a explorarse el agregado de precisiÃ³n al *stack* pero esto es
+  realmente muy complicado dado que la Ãºnica soluciÃ³n que pareciera viable es
+  el uso de *shadow stack* [HEND02]_ que requiere un trabajo extra por cada
+  llamado a funciÃ³n, cosa que va en contra de la filosofÃ­a de D_ de pagar solo
+  por lo que se usa. Sin embargo podrÃ­a explorarse agregar un esquema de ese
+  tipo como una opciÃ³n del compilador, de forma que el usuario pueda decidir
+  si vale la pena para una aplicaciÃ³n particular o no.
+
+* Mejoras en la concurrencia.
+
+  El *lock* global del recolector es otro aspecto que demostrÃ³ ser
+  problemÃ¡tico. PodrÃ­an analizarse formas de minimizar la necesidad de usar
+  *locks* o de hacerlo de forma mÃ¡s granular, de manera que algunas
+  operaciones del recolector puedan ser ejecutadas en paralelo. TambiÃ©n se
+  podrÃ­a experimentar con el uso de estructura de datos libres de *locks*
+  (*lock-free*).
+
+  Otra forma de minimizar la sincronizaciÃ³n es utilizando *pools* por hilo, de
+  manera de poder alocar memoria de forma concurrente y hasta explorar la
+  posibilidad de efectuar recolecciones locales a un solo hilo; aunque esto
+  Ãºltimo probablemente sea equivalente a implementar un recolector de basura
+  con particiones (por ejemplo generacional).
+
+* RecolecciÃ³n con movimiento.
+
+  La informaciÃ³n de tipos provista por el trabajo hecho por Vincent Lang
+  [DBZ3463]_ es suficientemente completa como para poder implementar un
+  recolector con movimiento. La efectividad de un recolector de estas
+  caracterÃ­sticas en D_ estÃ¡ por comprobarse, dado que cualquier celda
+  apuntada por alguna palabra que debiÃ³ ser marcada de forma conservativa debe
+  quedar inmÃ³vil, por lo que gran parte del Ã©xito de un recolector con
+  movimiento en D_ estÃ¡ supeditado a la proporciÃ³n de celdas que queden
+  inmÃ³viles. Sin embargo sea muy probablemente un Ã¡rea que valga la pena
+  explorar.
+
 
+.. include:: links.rst
 
 .. vim: set ts=3 sts=3 sw=3 et tw=78 spelllang=es :