X-Git-Url: https://git.llucax.com/z.facultad/75.00/presentacion.git/blobdiff_plain/d32955bcf49e8901ceb872c23ad958619756dc85..3f0d137266f7938e3318e9bb2f6517775609b8d8:/presentacion.rst?ds=inline

diff --git a/presentacion.rst b/presentacion.rst
index 95f3482..38f3551 100644
--- a/presentacion.rst
+++ b/presentacion.rst
@@ -17,7 +17,7 @@ PresentaciÃ³n
 MotivaciÃ³n
 ~~~~~~~~~~
 * RecolecciÃ³n de basura
-* Lenguaje de programaciÃ³n **D**
+* Lenguaje de programaciÃ³n D
 * Utilidad â Software Libre â ContribuciÃ³n
 
 
@@ -42,11 +42,11 @@ IntroducciÃ³n
 
 Â¿CÃ³mo?
 
-Algoritmos clÃ¡sicos
+Algoritmos ClÃ¡sicos
 ~~~~~~~~~~~~~~~~~~~
 * Conteo de referencias
-* **Marcado y barrido**
 * Copia de semi-espacio
+* **Marcado y barrido**
 
 .. raw:: latex
 
@@ -54,7 +54,7 @@ Algoritmos clÃ¡sicos
 
 .. dummy: para que ande bien el raw de arriba
 
-Estado del arte
+Estado del Arte
 ~~~~~~~~~~~~~~~
 * Medio siglo de investigaciÃ³n y desarrollo (3000+ publicaciones)
 * Objetivo
@@ -73,10 +73,10 @@ Estado del arte
   * AnÃ¡lisis estÃ¡tico
 
 
-El lenguaje de programaciÃ³n D
+El Lenguaje de ProgramaciÃ³n D
 --------------------------------------------------
 
-CaracterÃ­sticas generales
+CaracterÃ­sticas Generales
 ~~~~~~~~~~~~~~~~~~~~~~~~~
 * Sintaxis tipo C/C++
 * Compilado
@@ -109,108 +109,202 @@ Paradigmas
 
 
 
+Recolector de Basura de D
+==============================================================================
 
+ImplementaciÃ³n Actual
+--------------------------------------------------
 
+OrganizaciÃ³n del Heap
+~~~~~~~~~~~~~~~~~~~~~
+*Heap* â *Pools* â PÃ¡ginas â Bloques + Listas de libres
 
+.. image:: img/heap.pdf
+    :height: 6.7cm
 
+Bloques
+~~~~~~~
+* TamaÃ±o fijo (por pÃ¡gina)
 
+  * Potencias de 2
+  * De 16 a 4096 bytes
+  * MÃ¡s de 4096 (una pÃ¡gina)
 
+    * Objeto **grande**
+    * MÃºltiplo de pÃ¡ginas: 4096, 8192, ...
+    * En pÃ¡ginas contiguas (y mismo *pool*)
 
+* Indicadores (*bit sets* en *pool*)
 
+  * Marcado
 
-RecolecciÃ³n de Basura en D
-==============================================================================
+    * *mark*
+    * *scan*
+    * *noscan*
 
-Requerimientos
---------------------------------------------------
+  * Barrido
 
-SegÃºn paradigma
-~~~~~~~~~~~~~~~
-* ProgramaciÃ³n de bajo nivel
+    * *free*
+    * *finals*
 
-  * ``asm``
-  * ``union``
-  * ``extern (C)``
-  * ``malloc()``
+Algoritmo
+~~~~~~~~~
+* Marcado y barrido
 
-  â Conservativo + ManipulaciÃ³n de *root set*
+  * Marcado iterativo
 
-* ProgramaciÃ³n de alto nivel â Python/Ruby/Perl
+* Conservativo
 
-  * ``T[]``, ``T[K]``
+  * Con una pizca de *precisiÃ³n* (``NO_SCAN``)
 
-  â Punteros interiores
+* *Stop-the-world*
 
-* OrientaciÃ³n a objetos â Java
+  * Durante el marcado, en teorÃ­a
 
-  * ``~this()``
+* *Lock* global
 
-  â FinalizaciÃ³n
+  * Muy propenso a extender el tiempo de *stop-the-world* en la prÃ¡ctica
 
 
-ImplementaciÃ³n Actual
+Lo Bueno, lo Malo y lo Feo
 --------------------------------------------------
 
-OrganizaciÃ³n del heap
-~~~~~~~~~~~~~~~~~~~~~
-.. image:: img/heap.pdf
-    :height: 7cm
+Lo Bueno
+~~~~~~~~
+* Anda :)
+* OrganizaciÃ³n del *heap* (*two-level allocation*)
+* Marcado iterativo (!\ *overflow*)
+* *Bit set* para indicadores (cachÃ©)
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+(bueno != perfecto)
 
+Lo Malo y lo Feo
+~~~~~~~~~~~~~~~~
+Lo malo
 
-Lo Bueno, lo Malo y lo Feo
---------------------------------------------------
+* â Configurabilidad (*no silver bullet*)
+* â PrecisiÃ³n (informaciÃ³n de tipos) â Memoria inmortal
+* â Concurrencia â Grandes pausas
+* â Control sobre el factor de ocupaciÃ³n del *heap* â casos patolÃ³gicos
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+Lo feo
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+* El cÃ³digo (complejo, intrincado, duplicado, poco documentado) â DifÃ­cil de
+  mantener, modificar y mejorar
 
 
 
 Modificaciones Propuestas
 ==============================================================================
 
-PrecisiÃ³n
+Concurrencia
 --------------------------------------------------
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+fork(2)
+~~~~~~~
+* Hijo *nace* con una *fotografÃ­a* de la memoria del padre
+* Aisla modificaciones en la memoria de padre e hijo
+* Minimiza copia efectiva de memoria (*COW*)
+* Comienza con un solo hilo (el que llamÃ³ a ``fork(2)``)
+* Muy eficiente
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+Algoritmo Principal
+~~~~~~~~~~~~~~~~~~~
+* Basado en el trabajo de Gustavo Rodriguez-Rivera y Vince Russo (*Non-intrusive
+  Cloning Garbage Collector with Stock Operating System Support*)
+* Minimiza tiempo de pausa realizando fase de marcado **concurrente** vÃ­a
+  ``fork(2)``
+* Proceso padre sigue corriendo el programa
+* Proceso hijo realiza fase de marcado
+* Se comunican resultados vÃ­a memoria compartida
+* SincronizaciÃ³n mÃ­nima (``fork(2)`` + ``waitpid(2)``)
+
+Problemas
+~~~~~~~~~
+* Hilo que disparÃ³ la recolecciÃ³n bloqueado hasta fin de recolecciÃ³n completa
+  (marcado concurrente inclusive)
+* Otros hilos potencialmente bloqueados durante toda la recolecciÃ³n tambiÃ©n
+  (*lock* global)
 
+â Tiempo de pausa en la prÃ¡ctica ~= tiempo total de recolecciÃ³n
 
-Concurrencia
---------------------------------------------------
+Eager Allocation
+~~~~~~~~~~~~~~~~
+* Crea un nuevo *pool* de memoria antes de lanzar el marcado concurrente
+* Devuelve memoria del nuevo *pool* al programa mientras termina el marcado
+  concurrente
+* Permite al programa (**todos** sus hilos) seguir trabajando mientras se
+  realiza el marcado concurrente
+* Compromiso
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+  â Consumo de memoria
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+  â Tiempo de pausa real
 
+Early Collection
+~~~~~~~~~~~~~~~~
+* Dispara una recolecciÃ³n *preventiva* antes de que se agote la memoria
+* Permite al programa (**todos** sus hilos) seguir trabajando mientras la
+  recolecciÃ³n *preventiva* estÃ¡ en progreso
+* Si se agota la memoria antes de que la recolecciÃ³n *preventiva* finalice, se
+  vuelve a bloquear
+* Combinable con *eager allocation* para evitar bloquear
+* Pueden realizarse mÃ¡s recolecciones de las necesarias
+* Compromiso
+
+  â Consumo de procesador (potencialmente)
+
+  â Tiempo de pausa real (no garantizado)
 
-Optimizaciones
+
+Otras Mejoras
 --------------------------------------------------
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+PrecisiÃ³n
+~~~~~~~~~
+AdaptaciÃ³n del trabajo de Vincent Lang y David Simcha:
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+* Compilador genera informaciÃ³n sobre ubicaciÃ³n de los punteros para cada tipo
+  de dato
+
+  * Indica si una *palabra* debe ser escaneada
+  * Indica si una palabra es un puntero
+
+* Se pasa esa informaciÃ³n al recolector al momento de pedir memoria
+* Recolector original utiliza esa informaciÃ³n
+
+  * Almacena un puntero a la informaciÃ³n al final del bloque
+  * Utiliza la informaciÃ³n para escanear solo palabras que son punteros (con
+    seguridad o potencialmente)
+
+Optimizaciones y Otras Mejoras Menores
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+* Mejora del factor de ocupaciÃ³n del *heap*
+* CachÃ© de consultas crÃ­ticas para acelerar cuellos de botella
+* ReestructuraciÃ³n, modularizaciÃ³n, simplificaciÃ³n y limpieza del cÃ³digo
+* Pre-asignaciÃ³n de memoria
+* Optimizaciones algorÃ­tmicas sobre bÃºsquedas frecuentes
+* Registro de pedidos de memoria y recolecciones realizadas
+
+Configurabilidad
+~~~~~~~~~~~~~~~~
+* Configurable en *tiempo de arranque*
+* VÃ­a variable de entorno (``D_GC_OPTS``)
+* Viejas opciones convertidas
+
+  * ``mem_stop``
+  * ``sentinel``
+
+* Nuevas opciones
+
+  * ``pre_alloc``
+  * ``min_free``
+  * ``malloc_stats_file``
+  * ``collect_stats_file``
+  * ``conservative``
+  * ``fork``
+  * ``eager_alloc``
+  * ``early_collect``
 
 
 
@@ -220,49 +314,77 @@ Resultados
 Banco de Pruebas
 --------------------------------------------------
 
-Diapositiva 1
+Generalidades
 ~~~~~~~~~~~~~
-Diapositiva 1
+* MÃºltiples corridas (20-50)
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+  * Minimizar error en la mediciÃ³n
+  * Resultados expresados en funciÃ³n de:
 
+    * MÃ­nimo
+    * Media
+    * MÃ¡ximo
+    * DesvÃ­o estÃ¡ndar
 
-Tiempo de Stop-The-World
---------------------------------------------------
+* Minimizar variaciÃ³n entre corridas
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+  * ``cpufreq-set(1)``
+  * ``nice(1)``
+  * ``ionice(1)``
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+Programas
+~~~~~~~~~
+* Triviales (7)
 
+  * Ejercitar aspectos puntuales
+  * No realizan una tarea Ãºtil
+  * Casos patolÃ³gicos
 
-Tiempo de Pausa Real
---------------------------------------------------
+* Programas pequeÃ±os - *Olden Benchmark* (5)
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+  * Relativamente pequeÃ±os (400-1000 *SLOC*)
+  * Realizan una tarea Ãºtil
+  * Manipulan mucho listas y Ã¡rboles asignando mucha memoria
+  * No son ideales para probar un *GC*
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+* Programas reales - **Dil** (1)
+
+  * Compilador de D escrito en D
+  * Grande y complejo (32K+ *SLOC*, 86 mÃ³dulos, 300+ *clases*)
+  * Programado sin (limitaciones ni ventajas del) *GC* en mente
+  * ManipulaciÃ³n de *strings*, arreglos dinÃ¡micos y asociativos
 
+MÃ©tricas
+~~~~~~~~
+* Tiempo total de ejecuciÃ³n
+* Tiempo mÃ¡ximo de *stop-the-world*
+* Tiempo mÃ¡ximo de pausa real
+* Cantidad mÃ¡xima de memoria utilizada
 
-Tiempo de EjecuciÃ³n
+
+GrÃ¡ficos de Corridas
 --------------------------------------------------
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+Tiempo MÃ¡ximo de Stop-The-World
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+.. image:: img/norm-hist-stw.pdf
+    :width: 12.5cm
+
+Tiempo MÃ¡ximo de Pausa Real
+~~~~~~~~~~~~~~~~~~~~~~~~~~~
+.. image:: img/norm-hist-pause.pdf
+    :width: 12.5cm
+
+Cantidad MÃ¡xima de Memoria Utilizada
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+.. image:: img/norm-hist-mem.pdf
+    :width: 12.5cm
+
+Tiempo Total de EjecuciÃ³n
+~~~~~~~~~~~~~~~~~~~~~~~~~
+.. image:: img/norm-hist-time.pdf
+    :width: 12.5cm
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
 
 
 ConclusiÃ³n
@@ -273,18 +395,35 @@ ConclusiÃ³n
 
 Resumen
 ~~~~~~~
-* RecolecciÃ³n de basura â Inagotable
-* D â Multi-paradigma â DesafÃ­o
-* RecolecciÃ³n de basura en D â FÃ©rtil
-* Mejoras propuestas â Acierto
-* Resultados â Esperados + Inesperados
+* Objetivo principal
+
+  Minimizar tiempo de pausa para programas reales
+
+  Tiempo de pausa de Dil:
 
-Problemas, limitaciones y Puntos Pendientes
+  * *Stop-the-world* **160 veces menor** (1.66s â 0.01s)
+  * Pausa real **40 veces menor** (1.7s â 0.045s)
+
+* Objetivo secundario
+
+  No empeorar mucho el recolector actual en ningÃºn aspecto
+
+  UtilizaciÃ³n de memoria de Dil:
+
+  **50% mayor** (mucho *overhead* por marcado preciso)
+
+* Yapa
+
+  Tiempo total de ejecuciÃ³n de Dil:
+
+  Casi **3 veces menor** (55s â 20s)
+
+Problemas, Limitaciones y Puntos Pendientes
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-* PredicciÃ³n de *early collection*
 * ExplosiÃ³n de uso de memoria con *eager allocation*
+* Eficiencia del marcado preciso
+* Mejorar predicciÃ³n de *early collection*
 * Experimentar con ``clone(2)``
-* Eficiencia de marcado
 
 Trabajos Relacionados
 ~~~~~~~~~~~~~~~~~~~~~
@@ -295,9 +434,14 @@ Trabajos Relacionados
 
 * *Integrate Precise Heap Scanning Into the GC*
 
-  David Simcha (GC + diseÃ±o) + Vincent Lang (compilador). No formal, *bug
+  David Simcha (GC + diseÃ±o) y Vincent Lang (compilador). No formal, *bug
   report*, 2009-2010.
 
+* *Non-intrusive Cloning Garbage Collection with Stock Operating System Support*
+
+  Gustavo Rodriguez-Rivera y Vince Russo. Software Practiceand Experience
+  Volumen 27, NÃºmero 8.  Agosto 1997.
+
 Trabajos Futuros
 ~~~~~~~~~~~~~~~~
 * OrganizaciÃ³n de memoria
@@ -314,4 +458,5 @@ Fin
 ~~~
 Â¡Gracias!
 
+
 .. vim: set et sw=4 sts=4 spell spelllang=es :