X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/d325ba11aa45fb60fab88b72b37e129115caf95a..409ef528d2b45bdcbcd6868b3d0f82c1edf8e748:/source/conclusion.rst?ds=sidebyside

diff --git a/source/conclusion.rst b/source/conclusion.rst
index 945513d..ae6528d 100644
--- a/source/conclusion.rst
+++ b/source/conclusion.rst
@@ -2,7 +2,7 @@
 .. Se presentan las conclusiones del trabajo, comparando los resultados
    obtenidos con el punto de partida. Se mencionan puntos pendientes o
    nuevas lÃ­neas de investigaciÃ³n.
-   ESTADO: EMPEZADO
+   ESTADO: TERMINADO
 
 
 .. _conclusion:
@@ -63,6 +63,8 @@ total de ejecuciÃ³n de hasta 5 veces.
 
 
 
+.. _con_pending:
+
 Puntos pendientes, problemas y limitaciones
 ----------------------------------------------------------------------------
 
@@ -228,9 +230,10 @@ y limitaciones conocidas. A continuaciÃ³n se describe cada una de ellos.
   precio sin obtener los beneficios. Queda pendiente analizar en mÃ¡s detalle
   las causas de esto y posibles optimizaciones para subsanarlo.
 
-  .. ftable:: t:con-staticsize
+  .. flt:: t:con-staticsize
+     :type: table
 
-     Aumento del tamaÃ±o de la memoria estÃ¡tica (bytes).
+     Aumento del tamaÃ±o de la memoria estÃ¡tica (bytes)
 
      ======== ======== ======== =========== ===========
      Programa TBGC     CDGC     CDGC-TBGC   CDGC/TBGC
@@ -271,9 +274,10 @@ y limitaciones conocidas. A continuaciÃ³n se describe cada una de ellos.
   pÃ©rdida de rendimiento, dado que puede afectar a la localidad de referencia
   del cachÃ©, por ejemplo.
 
-  .. ftable:: t:con-binsize
+  .. flt:: t:con-binsize
+     :type: table
 
-     Aumento del tamaÃ±o del binario (bytes).
+     Aumento del tamaÃ±o del binario (bytes)
 
      ======== ======== ======== =========== ===========
      Programa TBGC     CDGC     CDGC-TBGC   CDGC/TBGC
@@ -298,40 +302,148 @@ y limitaciones conocidas. A continuaciÃ³n se describe cada una de ellos.
 Trabajos relacionados
 ----------------------------------------------------------------------------
 
-Dado que D_ no estÃ¡ muy difundido en Ã¡mbitos acadÃ©micos, la cantidad de
-trabajos relacionados es muy pequeÃ±a, sin embargo los hay, y a continuaciÃ³n se
-describen.
+Dado que D_ no ha penetrado en Ã¡mbitos acadÃ©micos, se ha encontrado un solo
+trabajo de investigaciÃ³n relacionado. Sin embargo se ha encontrado otro
+trabajo que si bien no es formal, ha sido de mucha importancia para el
+desarrollo de este trabajo.
+
+A continuaciÃ³n se describen ambos.
+
+* *Memory Management in the D Programming Language* [PAN09]_.
+
+  Tesis de licenciatura de Vladimir Panteleev cuya resumen traducido es el
+  siguiente:
+
+      Este reporte describe el estudio de las tÃ©cnicas de manejo automÃ¡tico de
+      memoria, su implementaciÃ³n en el lenguaje de programaciÃ³n D_, y el
+      trabajo para mejorar el estado del manejo de memoria.
+
+  Si bien plantea pequeÃ±as optimizaciones para el recolector de basura
+  (algunas utilizadas en este trabajo), se centra principalmente en el
+  desarrollo de Diamond, una utilidad para depuraciÃ³n de manejo de memoria en
+  D_.
+
+* IntegraciÃ³n de marcado preciso del *heap* al recolector de basura
+  [DBZ3463]_.
+
+  Ya citado varias veces en este trabajo, fue comenzado por David Simcha
+  y publicado en el sistema de seguimiento de fallas de D_ que se limita a una
+  implementaciÃ³n a nivel biblioteca de usuario y sobre `D 2.0`_. Vincent Lang
+  (mejor conocido como *wm4* en la comunidad de D_) da continuidad a este
+  trabajo pero modificando el compilador DMD_ y trabajando con `D 1.0`_
+  y Tango_.
+
+  El soporte de marcado preciso presentado en este trabajo se basa en las
+  modificaciones hechas al compilador DMD_ por Vincent Lang (que aÃºn no fueron
+  integradas de forma oficial).
 
-* Diamond [PAN09]_:
-  http://thecybershadow.net/d/Memory_Management_in_the_D_Programming_Language.pdf
 
 
 Trabajos futuros
 ----------------------------------------------------------------------------
 
-TODO
-
-* Cambiar el layout de memoria (mostrar lo encontrado en el post). Se podrÃ­a
-  usar un tamaÃ±o de bloque por cada tipo de dato (y por lo tanto una lista de
-  libres por cada tipo de dato). Esto podrÃ­a ahorrar muchos bits (mark,
-  freebits, scan, etc.), el puntero al pointer mask se guardarÃ­a una sola vez,
-  no hay ningÃºn desperdicio de espacio salvo algÃºn padding, pero podrÃ­an haber
-  esquemas donde ni siquiera (si siempre se alocan tantas pÃ¡ginas como sean
-  necesarias para evitar el padding para un tamaÃ±o de bloque). Un tipo de dato
-  NO_SCAN no alocarÃ­a directamente bits de noscan, mark y scan. Se podrÃ­a
-  tratar de forma especial a strings.
-* Lazy sweeping.
-* Concurrent sweeping (lanzar fase de sweep en un thread que no pertenezca al
-  mutator).
-* Continuous collection (lanzar un thread que estÃ© haciendo fullcollect() en
-  un loop). Lo bueno es que el sweep podrÃ­a correr en ese thread, bajando aÃºn
-  mÃ¡s el tiempo mÃ¡ximo de pausa (aunque esto se puede hacer mÃ¡s allÃ¡ de hacer
-  continuous collection, ver "concurrent sweeping"), lo malo es que tal vez se
-  estarÃ­a recolectando demasiado sin ninguna ganancia substancial.
-* Hacer preciso el static data por el tema de los TypeInfo's que ocupan mucha
-  memoria que debe ser escaneada.
-* Tratar de remover el *lock* global.
-* Implementar un recolector con movimiento.
+En la secciÃ³n :ref:`con_pending` se mencionan varios aspectos de este trabajo
+que podrÃ­an verse beneficiados por trabajos futuros, sin embargo se trata en
+general de pequeÃ±as optimizaciones o mejoras de alcance muy limitado.
+
+A continuaciÃ³n se recopilan varios otros aspectos identificados durante el
+desarrollo del presente trabajo, pero que requieren un nivel de anÃ¡lisis
+y, potencialmente, de desarrollo mayor a los ya presentados en la secciÃ³n
+mencionada.
+
+* Mejoras en la organizaciÃ³n de memoria del recolector.
+
+  Si bien se ha mencionado en un principio la organizaciÃ³n actual como un
+  aspecto positivo del recolector, varios resultados han demostrado
+  deficiencias importantes. El nivel de espacio desperdiciado por la divisiÃ³n
+  de memoria en bloques puede ser muy significativa y la forma en la que se
+  almacena la informaciÃ³n de tipos para el marcado preciso puede incluso
+  acentuarlo todavÃ­a mÃ¡s (como se demuestra en los resultados para ``bh``
+  y ``dil``).
+
+  Este problema no solo afecta al consumo de memoria, ademÃ¡s genera un efecto
+  dominÃ³ por el incremento de la probabilidad de tener *falsos punteros*
+  y perjudica al tiempo total de ejecuciÃ³n por empeorar la localidad de
+  referencia del cachÃ© y por hacer que se prolongue la recolecciÃ³n de basura
+  por tener que marcar y barrer mÃ¡s memoria.
+
+  Una posible alternativa es tener una lista de libres por **tipo**, cuyo
+  tamaÃ±o de bloque sea exactamente igual al tamaÃ±o del tipo que almacena. La
+  informaciÃ³n de tipo se almacenarÃ­a entonces solo una vez y no habrÃ­a
+  desperdicio de memoria alguno dejando de lado un posible relleno para
+  completar una pÃ¡gina. Este esquema deberÃ­a tener algÃºn tipo de guarda para
+  programas con una cantidad exuberante de tipos de datos.
+
+  TambiÃ©n podrÃ­a ser conveniente separar los bloques marcados como ``NO_SCAN``
+  de los que sÃ­ deben ser marcados, de manera que no necesite almacenar
+  directamente los bits de ``mark`` , ``scan`` y ``noscan``. TambiÃ©n se podrÃ­a
+  proponer algÃºn Ã¡rea de memoria especial para almacenar cadenas de texto
+  (como un caso especial de lo anterior) por tener estas caracterÃ­sticas muy
+  particular (largos muy variables, cambian de tamaÃ±o de forma relativamente
+  frecuente, etc.). Las posibilidades son enormes.
+
+* Mejoras en la fase de barrido.
+
+  En este trabajo todas las mejoras propuestas se encargaron de la fase de
+  marcado, pero mucho se pude mejorar en la fase de barrido tambiÃ©n. Por un
+  lado se podrÃ­a agregar barrido perezoso para disminuir aÃºn mÃ¡s el tiempo de
+  pausa real. Se ha mostrado que en muchos casos los tiempos de pausa pueden
+  ser considerablemente altos debido a que la fase de barrido no se realiza en
+  paralelo como el marcado.
+
+  Otra forma de disminuir el tiempo de pausa real serÃ­a realizar un barrido
+  concurrente tambiÃ©n. Esto no puede realizarse en otro proceso porque el
+  barrido es el encargado de ejecutar los *finalizadores*, pero sÃ­ se podrÃ­a
+  barrer en otro hilo y, por ejemplo, seguir utilizando *eager allocation*
+  hasta que el barrido finalice.
+
+* Mejoras en la precisiÃ³n del marcado.
+
+  Como se mencionÃ³ anteriormente, el Ã¡rea de memoria estÃ¡tica se marca de
+  forma conservativa dada la falta de informaciÃ³n de tipos de Ã©sta. Sin
+  embargo es bastante razonable pensar en que el compilador genere informaciÃ³n
+  de tipos para el Ã¡rea de memoria estÃ¡tica o que al menos informe mejor al
+  recolector que partes deben ser consideradas parte del *root set* y cuales
+  no. Dado que la memoria estÃ¡tica crece de forma considerable con el
+  incremento de la cantidad de tipos definidos por el usuario, ya solo esa
+  divisiÃ³n puede hacer una diferencia importante; en especial considerando
+  como aumenta la memoria estÃ¡tica solamente por usar mÃ¡s tipos de datos en el
+  recolector.
+
+  TambiÃ©n podrÃ­a explorarse el agregado de precisiÃ³n al *stack* pero esto es
+  realmente muy complicado dado que la Ãºnica soluciÃ³n que pareciera viable es
+  el uso de *shadow stack* [HEND02]_ que requiere un trabajo extra por cada
+  llamado a funciÃ³n, cosa que va en contra de la filosofÃ­a de D_ de pagar solo
+  por lo que se usa. Sin embargo podrÃ­a explorarse agregar un esquema de ese
+  tipo como una opciÃ³n del compilador, de forma que el usuario pueda decidir
+  si vale la pena para una aplicaciÃ³n particular o no.
+
+* Mejoras en la concurrencia.
+
+  El *lock* global del recolector es otro aspecto que demostrÃ³ ser
+  problemÃ¡tico. PodrÃ­an analizarse formas de minimizar la necesidad de usar
+  *locks* o de hacerlo de forma mÃ¡s granular, de manera que algunas
+  operaciones del recolector puedan ser ejecutadas en paralelo. TambiÃ©n se
+  podrÃ­a experimentar con el uso de estructura de datos libres de *locks*
+  (*lock-free*).
+
+  Otra forma de minimizar la sincronizaciÃ³n es utilizando *pools* por hilo, de
+  manera de poder alocar memoria de forma concurrente y hasta explorar la
+  posibilidad de efectuar recolecciones locales a un solo hilo; aunque esto
+  Ãºltimo probablemente sea equivalente a implementar un recolector de basura
+  con particiones (por ejemplo generacional).
+
+* RecolecciÃ³n con movimiento.
+
+  La informaciÃ³n de tipos provista por el trabajo hecho por Vincent Lang
+  [DBZ3463]_ es suficientemente completa como para poder implementar un
+  recolector con movimiento. La efectividad de un recolector de estas
+  caracterÃ­sticas en D_ estÃ¡ por comprobarse, dado que cualquier celda
+  apuntada por alguna palabra que debiÃ³ ser marcada de forma conservativa debe
+  quedar inmÃ³vil, por lo que gran parte del Ã©xito de un recolector con
+  movimiento en D_ estÃ¡ supeditado a la proporciÃ³n de celdas que queden
+  inmÃ³viles. Sin embargo sea muy probablemente un Ã¡rea que valga la pena
+  explorar.
 
 
 .. include:: links.rst