X-Git-Url: https://git.llucax.com/z.facultad/75.00/presentacion.git/blobdiff_plain/3f0d137266f7938e3318e9bb2f6517775609b8d8..3f965dcd7fa6110f68cc8e993685f32fbf8616b4:/presentacion.rst

diff --git a/presentacion.rst b/presentacion.rst
index 38f3551..113ec0a 100644
--- a/presentacion.rst
+++ b/presentacion.rst
@@ -5,27 +5,30 @@ RecolecciÃ³n de Basura en D
 
 :Autor: Leandro Lucarella
 :Fecha: Diciembre 2010
-:OrganizaciÃ³n: FIUBA
+:OrganizaciÃ³n: Facultad de IngenierÃ­a, UBA
 
 
 IntroducciÃ³n
 ==============================================================================
 
-PresentaciÃ³n
+IntroducciÃ³n
 --------------------------------------------------
 
 MotivaciÃ³n
 ~~~~~~~~~~
 * RecolecciÃ³n de basura
 * Lenguaje de programaciÃ³n D
-* Utilidad â Software Libre â ContribuciÃ³n
+* InvestigaciÃ³n + aplicaciÃ³n
+* Software Libre
 
+.. r2b-note::
 
-RecolecciÃ³n de Basura
---------------------------------------------------
+    1 min de presentaciÃ³n
 
-IntroducciÃ³n
-~~~~~~~~~~~~
+    1.5 min / 2.5 min
+
+RecolecciÃ³n de Basura
+~~~~~~~~~~~~~~~~~~~~~
 Â¿QuÃ©?
 
 * AdministraciÃ³n automÃ¡tica de memoria
@@ -33,122 +36,21 @@ IntroducciÃ³n
 Â¿Para quÃ©?
 
 * Simplificar interfaces
-* Mejorar eficiencia (**!**)
 * Evitar errores de memoria
-
-  * *Dangling pointers*
-  * *Memory leaks*
-  * *Double free*
+* Mejorar eficiencia (**!**)
 
 Â¿CÃ³mo?
 
-Algoritmos ClÃ¡sicos
-~~~~~~~~~~~~~~~~~~~
-* Conteo de referencias
-* Copia de semi-espacio
-* **Marcado y barrido**
-
-.. raw:: latex
-
-    \multiinclude[format=pdf,graphics={height=4.5cm}]{img/mark-sweep}
-
-.. dummy: para que ande bien el raw de arriba
-
-Estado del Arte
-~~~~~~~~~~~~~~~
-* Medio siglo de investigaciÃ³n y desarrollo (3000+ publicaciones)
-* Objetivo
-
-  * â Tiempo total de ejecuciÃ³n
-  * â Cantidad de recolecciones
-  * â Tiempo de recolecciÃ³n
-  * â **Tiempo (mÃ¡ximo) de pausa**
-
-* TÃ©cnicas
-
-  * Particiones
-  * **Concurrencia**
-  * OrganizaciÃ³n de memoria
-  * **PrecisiÃ³n**
-  * AnÃ¡lisis estÃ¡tico
-
-
-El Lenguaje de ProgramaciÃ³n D
---------------------------------------------------
-
-CaracterÃ­sticas Generales
-~~~~~~~~~~~~~~~~~~~~~~~~~
-* Sintaxis tipo C/C++
-* Compilado
-* Sistema de tipos estÃ¡tico
-* Multi-paradigma
-
-Paradigmas
-~~~~~~~~~~
-* ProgramaciÃ³n de bajo nivel (*system-programming*) â C/C++
-
-  * ``asm``
-  * ``union``
-  * ``extern (C)``
-  * ``malloc()``
-
-  â Conservativo + ManipulaciÃ³n de *root set*
-
-* ProgramaciÃ³n de alto nivel â Python/Ruby/Perl
-
-  * *GC*
-  * ``T[]``, ``T[K]``
-
-  â Punteros interiores
-
-* OrientaciÃ³n a objetos â Java
-
-  * ``~this()``
+* AnÃ¡lisis del grafo de conectividad del *heap*
+* 50+ aÃ±os de desarrollo
+* 3000+ *papers*
 
-  â FinalizaciÃ³n
+.. r2b-note::
 
+    5 min / 7.5 min
 
-
-Recolector de Basura de D
-==============================================================================
-
-ImplementaciÃ³n Actual
---------------------------------------------------
-
-OrganizaciÃ³n del Heap
-~~~~~~~~~~~~~~~~~~~~~
-*Heap* â *Pools* â PÃ¡ginas â Bloques + Listas de libres
-
-.. image:: img/heap.pdf
-    :height: 6.7cm
-
-Bloques
-~~~~~~~
-* TamaÃ±o fijo (por pÃ¡gina)
-
-  * Potencias de 2
-  * De 16 a 4096 bytes
-  * MÃ¡s de 4096 (una pÃ¡gina)
-
-    * Objeto **grande**
-    * MÃºltiplo de pÃ¡ginas: 4096, 8192, ...
-    * En pÃ¡ginas contiguas (y mismo *pool*)
-
-* Indicadores (*bit sets* en *pool*)
-
-  * Marcado
-
-    * *mark*
-    * *scan*
-    * *noscan*
-
-  * Barrido
-
-    * *free*
-    * *finals*
-
-Algoritmo
-~~~~~~~~~
+Recolector Actual de D
+~~~~~~~~~~~~~~~~~~~~~~
 * Marcado y barrido
 
   * Marcado iterativo
@@ -159,68 +61,76 @@ Algoritmo
 
 * *Stop-the-world*
 
-  * Durante el marcado, en teorÃ­a
+  * Durante el marcado (en teorÃ­a)
 
 * *Lock* global
 
   * Muy propenso a extender el tiempo de *stop-the-world* en la prÃ¡ctica
 
+.. r2b-note::
 
-Lo Bueno, lo Malo y lo Feo
---------------------------------------------------
+    3 min / 33 min
 
-Lo Bueno
-~~~~~~~~
+Recolector Actual - Lo Bueno
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 * Anda :)
-* OrganizaciÃ³n del *heap* (*two-level allocation*)
+* OrganizaciÃ³n del *heap* (< fragmentaciÃ³n)
 * Marcado iterativo (!\ *overflow*)
-* *Bit set* para indicadores (cachÃ©)
+* *Bitset* para bits de marca (*cache friendly*)
 
 (bueno != perfecto)
 
-Lo Malo y lo Feo
-~~~~~~~~~~~~~~~~
+.. r2b-note::
+
+    5 min / 38 min
+
+Recolector Actual - Lo Malo y lo Feo
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 Lo malo
 
 * â Configurabilidad (*no silver bullet*)
 * â PrecisiÃ³n (informaciÃ³n de tipos) â Memoria inmortal
 * â Concurrencia â Grandes pausas
-* â Control sobre el factor de ocupaciÃ³n del *heap* â casos patolÃ³gicos
+* â Control sobre el factor de ocupaciÃ³n del *heap*
+
+  â Casos patolÃ³gicos
 
 Lo feo
 
-* El cÃ³digo (complejo, intrincado, duplicado, poco documentado) â DifÃ­cil de
-  mantener, modificar y mejorar
+* El cÃ³digo (complejo, intrincado, duplicado, poco documentado)
+
+  â DifÃ­cil de mantener, modificar y mejorar
+
+.. r2b-note::
+
+    3.5 min / 41.5 min
 
 
 
 Modificaciones Propuestas
 ==============================================================================
 
-Concurrencia
+Modificaciones Propuestas
 --------------------------------------------------
 
-fork(2)
-~~~~~~~
-* Hijo *nace* con una *fotografÃ­a* de la memoria del padre
-* Aisla modificaciones en la memoria de padre e hijo
-* Minimiza copia efectiva de memoria (*COW*)
-* Comienza con un solo hilo (el que llamÃ³ a ``fork(2)``)
-* Muy eficiente
-
-Algoritmo Principal
-~~~~~~~~~~~~~~~~~~~
-* Basado en el trabajo de Gustavo Rodriguez-Rivera y Vince Russo (*Non-intrusive
-  Cloning Garbage Collector with Stock Operating System Support*)
-* Minimiza tiempo de pausa realizando fase de marcado **concurrente** vÃ­a
+Concurrencia
+~~~~~~~~~~~~
+* Algoritmo basado en el trabajo de Gustavo Rodriguez-Rivera y Vince Russo
+  (*Non-intrusive Cloning Garbage Collector with Stock Operating System
+  Support*)
+* Minimiza tiempo de pausa realizando fase de **marcado concurrente** vÃ­a
   ``fork(2)``
 * Proceso padre sigue corriendo el programa
 * Proceso hijo realiza fase de marcado
 * Se comunican resultados vÃ­a memoria compartida
 * SincronizaciÃ³n mÃ­nima (``fork(2)`` + ``waitpid(2)``)
 
-Problemas
-~~~~~~~~~
+.. r2b-note::
+
+    2.5 min / 44 min
+
+Concurrencia - Problemas
+~~~~~~~~~~~~~~~~~~~~~~~~
 * Hilo que disparÃ³ la recolecciÃ³n bloqueado hasta fin de recolecciÃ³n completa
   (marcado concurrente inclusive)
 * Otros hilos potencialmente bloqueados durante toda la recolecciÃ³n tambiÃ©n
@@ -228,8 +138,12 @@ Problemas
 
 â Tiempo de pausa en la prÃ¡ctica ~= tiempo total de recolecciÃ³n
 
-Eager Allocation
-~~~~~~~~~~~~~~~~
+.. r2b-note::
+
+    2.5 min / 46.5 min
+
+Concurrencia - Eager Allocation
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 * Crea un nuevo *pool* de memoria antes de lanzar el marcado concurrente
 * Devuelve memoria del nuevo *pool* al programa mientras termina el marcado
   concurrente
@@ -241,8 +155,12 @@ Eager Allocation
 
   â Tiempo de pausa real
 
-Early Collection
-~~~~~~~~~~~~~~~~
+.. r2b-note::
+
+    6.5 min / 53 min
+
+Concurrencia - Early Collection
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 * Dispara una recolecciÃ³n *preventiva* antes de que se agote la memoria
 * Permite al programa (**todos** sus hilos) seguir trabajando mientras la
   recolecciÃ³n *preventiva* estÃ¡ en progreso
@@ -256,113 +174,36 @@ Early Collection
 
   â Tiempo de pausa real (no garantizado)
 
+.. r2b-note::
 
-Otras Mejoras
---------------------------------------------------
-
-PrecisiÃ³n
-~~~~~~~~~
-AdaptaciÃ³n del trabajo de Vincent Lang y David Simcha:
+    3.5 min / 56.5 min
 
-* Compilador genera informaciÃ³n sobre ubicaciÃ³n de los punteros para cada tipo
-  de dato
+    Si hago una recolecciÃ³n cuando queda 20% de memoria libre y nadie pide mÃ¡s
+    memoria mientras se recolecta, es como si tuviera 20% menos de memoria
+    disponible para el programa => mÃ¡s recolecciones => mÃ¡s consumo de CPU (y
+    potencialmente run-time)
 
-  * Indica si una *palabra* debe ser escaneada
-  * Indica si una palabra es un puntero
-
-* Se pasa esa informaciÃ³n al recolector al momento de pedir memoria
-* Recolector original utiliza esa informaciÃ³n
-
-  * Almacena un puntero a la informaciÃ³n al final del bloque
-  * Utiliza la informaciÃ³n para escanear solo palabras que son punteros (con
-    seguridad o potencialmente)
-
-Optimizaciones y Otras Mejoras Menores
-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+Otras Mejoras
+~~~~~~~~~~~~~
+* Marcado semi-preciso del *heap*
 * Mejora del factor de ocupaciÃ³n del *heap*
 * CachÃ© de consultas crÃ­ticas para acelerar cuellos de botella
 * ReestructuraciÃ³n, modularizaciÃ³n, simplificaciÃ³n y limpieza del cÃ³digo
 * Pre-asignaciÃ³n de memoria
 * Optimizaciones algorÃ­tmicas sobre bÃºsquedas frecuentes
 * Registro de pedidos de memoria y recolecciones realizadas
+* Configurabilidad (en *tiempo de inicializaciÃ³n*)
 
-Configurabilidad
-~~~~~~~~~~~~~~~~
-* Configurable en *tiempo de arranque*
-* VÃ­a variable de entorno (``D_GC_OPTS``)
-* Viejas opciones convertidas
-
-  * ``mem_stop``
-  * ``sentinel``
-
-* Nuevas opciones
+.. r2b-note::
 
-  * ``pre_alloc``
-  * ``min_free``
-  * ``malloc_stats_file``
-  * ``collect_stats_file``
-  * ``conservative``
-  * ``fork``
-  * ``eager_alloc``
-  * ``early_collect``
+    2 min / 58.5 min
 
 
 
 Resultados
 ==============================================================================
 
-Banco de Pruebas
---------------------------------------------------
-
-Generalidades
-~~~~~~~~~~~~~
-* MÃºltiples corridas (20-50)
-
-  * Minimizar error en la mediciÃ³n
-  * Resultados expresados en funciÃ³n de:
-
-    * MÃ­nimo
-    * Media
-    * MÃ¡ximo
-    * DesvÃ­o estÃ¡ndar
-
-* Minimizar variaciÃ³n entre corridas
-
-  * ``cpufreq-set(1)``
-  * ``nice(1)``
-  * ``ionice(1)``
-
-Programas
-~~~~~~~~~
-* Triviales (7)
-
-  * Ejercitar aspectos puntuales
-  * No realizan una tarea Ãºtil
-  * Casos patolÃ³gicos
-
-* Programas pequeÃ±os - *Olden Benchmark* (5)
-
-  * Relativamente pequeÃ±os (400-1000 *SLOC*)
-  * Realizan una tarea Ãºtil
-  * Manipulan mucho listas y Ã¡rboles asignando mucha memoria
-  * No son ideales para probar un *GC*
-
-* Programas reales - **Dil** (1)
-
-  * Compilador de D escrito en D
-  * Grande y complejo (32K+ *SLOC*, 86 mÃ³dulos, 300+ *clases*)
-  * Programado sin (limitaciones ni ventajas del) *GC* en mente
-  * ManipulaciÃ³n de *strings*, arreglos dinÃ¡micos y asociativos
-
-MÃ©tricas
-~~~~~~~~
-* Tiempo total de ejecuciÃ³n
-* Tiempo mÃ¡ximo de *stop-the-world*
-* Tiempo mÃ¡ximo de pausa real
-* Cantidad mÃ¡xima de memoria utilizada
-
-
-GrÃ¡ficos de Corridas
+Resultados
 --------------------------------------------------
 
 Tiempo MÃ¡ximo de Stop-The-World
@@ -370,21 +211,47 @@ Tiempo MÃ¡ximo de Stop-The-World
 .. image:: img/norm-hist-stw.pdf
     :width: 12.5cm
 
+.. r2b-note::
+
+    5.5 min / 67.5 min
+
+    Explicar brevemente divisiÃ³n de pruebas (cual es trivial, pequeÃ±a, real)
+
 Tiempo MÃ¡ximo de Pausa Real
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~
 .. image:: img/norm-hist-pause.pdf
     :width: 12.5cm
 
+.. r2b-note::
+
+    2 min / 69.5 min
+
+    Explicar que donde hay grandes diferencias, es por tiempo de barrido
+
 Cantidad MÃ¡xima de Memoria Utilizada
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 .. image:: img/norm-hist-mem.pdf
     :width: 12.5cm
 
+.. r2b-note::
+
+    3.5 min / 73 min
+
+    Enganchar lo anterior con la relaciÃ³n con el consumo de memoria
+
 Tiempo Total de EjecuciÃ³n
 ~~~~~~~~~~~~~~~~~~~~~~~~~
 .. image:: img/norm-hist-time.pdf
     :width: 12.5cm
 
+.. r2b-note::
+
+    7 min / 80 min
+
+    * mcore y split bajan mucho por cachÃ© de tamaÃ±o
+    * rnddata baja mucho por marcado preciso
+    * bigarr y sbtree suben porque no hacen mÃ¡s que alocar
+
 
 
 ConclusiÃ³n
@@ -418,6 +285,10 @@ Resumen
 
   Casi **3 veces menor** (55s â 20s)
 
+.. r2b-note::
+
+    4 min / 84 min
+
 Problemas, Limitaciones y Puntos Pendientes
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 * ExplosiÃ³n de uso de memoria con *eager allocation*
@@ -425,6 +296,10 @@ Problemas, Limitaciones y Puntos Pendientes
 * Mejorar predicciÃ³n de *early collection*
 * Experimentar con ``clone(2)``
 
+.. r2b-note::
+
+    3 min / 87 min
+
 Trabajos Relacionados
 ~~~~~~~~~~~~~~~~~~~~~
 * *Memory Management in the D Programming Language*
@@ -442,14 +317,22 @@ Trabajos Relacionados
   Gustavo Rodriguez-Rivera y Vince Russo. Software Practiceand Experience
   Volumen 27, NÃºmero 8.  Agosto 1997.
 
+.. r2b-note::
+
+    1.5 min / 88.5 min
+
 Trabajos Futuros
 ~~~~~~~~~~~~~~~~
 * OrganizaciÃ³n de memoria
 * Barrido
-* PrecisiÃ³n
+* \+ PrecisiÃ³n
 * Concurrencia â *Lock* **global**
 * Movimiento
 
+.. r2b-note::
+
+    1.5 min / 92 min
+
 Preguntas
 ~~~~~~~~~
 Â¿?