X-Git-Url: https://git.llucax.com/z.facultad/75.00/presentacion.git/blobdiff_plain/9894a76113749670dd708db1356c9853cf5f43ca..3f965dcd7fa6110f68cc8e993685f32fbf8616b4:/presentacion.rst

diff --git a/presentacion.rst b/presentacion.rst
index 3e39603..113ec0a 100644
--- a/presentacion.rst
+++ b/presentacion.rst
@@ -5,27 +5,30 @@ RecolecciÃ³n de Basura en D
 
 :Autor: Leandro Lucarella
 :Fecha: Diciembre 2010
-:OrganizaciÃ³n: FIUBA
+:OrganizaciÃ³n: Facultad de IngenierÃ­a, UBA
 
 
 IntroducciÃ³n
 ==============================================================================
 
-PresentaciÃ³n
+IntroducciÃ³n
 --------------------------------------------------
 
 MotivaciÃ³n
 ~~~~~~~~~~
 * RecolecciÃ³n de basura
-* Lenguaje de programaciÃ³n **D**
-* Utilidad â Software Libre â ContribuciÃ³n
+* Lenguaje de programaciÃ³n D
+* InvestigaciÃ³n + aplicaciÃ³n
+* Software Libre
 
+.. r2b-note::
 
-RecolecciÃ³n de Basura
---------------------------------------------------
+    1 min de presentaciÃ³n
 
-IntroducciÃ³n
-~~~~~~~~~~~~
+    1.5 min / 2.5 min
+
+RecolecciÃ³n de Basura
+~~~~~~~~~~~~~~~~~~~~~
 Â¿QuÃ©?
 
 * AdministraciÃ³n automÃ¡tica de memoria
@@ -33,258 +36,269 @@ IntroducciÃ³n
 Â¿Para quÃ©?
 
 * Simplificar interfaces
-* Mejorar eficiencia (**!**)
 * Evitar errores de memoria
-
-  * *Dangling pointers*
-  * *Memory leaks*
-  * *Double free*
+* Mejorar eficiencia (**!**)
 
 Â¿CÃ³mo?
 
-Algoritmos clÃ¡sicos
-~~~~~~~~~~~~~~~~~~~
-* Conteo de referencias
-* **Marcado y barrido**
-* Copia de semi-espacio
+* AnÃ¡lisis del grafo de conectividad del *heap*
+* 50+ aÃ±os de desarrollo
+* 3000+ *papers*
 
-.. raw:: latex
+.. r2b-note::
 
-    \multiinclude[format=pdf,graphics={height=4.5cm}]{img/mark-sweep}
+    5 min / 7.5 min
 
-.. dummy: para que ande bien el raw de arriba
+Recolector Actual de D
+~~~~~~~~~~~~~~~~~~~~~~
+* Marcado y barrido
 
-Estado del arte
-~~~~~~~~~~~~~~~
-* Medio siglo de investigaciÃ³n y desarrollo (3000+ publicaciones)
-* Objetivo
+  * Marcado iterativo
 
-  * â Tiempo total de ejecuciÃ³n
-  * â Cantidad de recolecciones
-  * â Tiempo de recolecciÃ³n
-  * â **Tiempo (mÃ¡ximo) de pausa**
+* Conservativo
 
-* TÃ©cnicas
+  * Con una pizca de *precisiÃ³n* (``NO_SCAN``)
 
-  * Particiones
-  * **Concurrencia**
-  * OrganizaciÃ³n de memoria
-  * **PrecisiÃ³n**
-  * AnÃ¡lisis estÃ¡tico
+* *Stop-the-world*
 
+  * Durante el marcado (en teorÃ­a)
 
-El lenguaje de programaciÃ³n D
---------------------------------------------------
+* *Lock* global
 
-CaracterÃ­sticas generales
-~~~~~~~~~~~~~~~~~~~~~~~~~
-* Sintaxis tipo C/C++
-* Compilado
-* Sistema de tipos estÃ¡tico
-* Multi-paradigma
-
-Paradigmas
-~~~~~~~~~~
-* ProgramaciÃ³n de bajo nivel (*system-programming*) â C/C++
+  * Muy propenso a extender el tiempo de *stop-the-world* en la prÃ¡ctica
 
-  * ``asm``
-  * ``union``
-  * ``extern (C)``
-  * ``malloc()``
+.. r2b-note::
 
-  â Conservativo + ManipulaciÃ³n de *root set*
+    3 min / 33 min
 
-* ProgramaciÃ³n de alto nivel â Python/Ruby/Perl
+Recolector Actual - Lo Bueno
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+* Anda :)
+* OrganizaciÃ³n del *heap* (< fragmentaciÃ³n)
+* Marcado iterativo (!\ *overflow*)
+* *Bitset* para bits de marca (*cache friendly*)
 
-  * *GC*
-  * ``T[]``, ``T[K]``
+(bueno != perfecto)
 
-  â Punteros interiores
+.. r2b-note::
 
-* OrientaciÃ³n a objetos â Java
+    5 min / 38 min
 
-  * ``~this()``
+Recolector Actual - Lo Malo y lo Feo
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+Lo malo
 
-  â FinalizaciÃ³n
+* â Configurabilidad (*no silver bullet*)
+* â PrecisiÃ³n (informaciÃ³n de tipos) â Memoria inmortal
+* â Concurrencia â Grandes pausas
+* â Control sobre el factor de ocupaciÃ³n del *heap*
 
+  â Casos patolÃ³gicos
 
+Lo feo
 
+* El cÃ³digo (complejo, intrincado, duplicado, poco documentado)
 
+  â DifÃ­cil de mantener, modificar y mejorar
 
+.. r2b-note::
 
+    3.5 min / 41.5 min
 
 
 
+Modificaciones Propuestas
+==============================================================================
 
+Modificaciones Propuestas
+--------------------------------------------------
 
+Concurrencia
+~~~~~~~~~~~~
+* Algoritmo basado en el trabajo de Gustavo Rodriguez-Rivera y Vince Russo
+  (*Non-intrusive Cloning Garbage Collector with Stock Operating System
+  Support*)
+* Minimiza tiempo de pausa realizando fase de **marcado concurrente** vÃ­a
+  ``fork(2)``
+* Proceso padre sigue corriendo el programa
+* Proceso hijo realiza fase de marcado
+* Se comunican resultados vÃ­a memoria compartida
+* SincronizaciÃ³n mÃ­nima (``fork(2)`` + ``waitpid(2)``)
 
-RecolecciÃ³n de Basura en D
-==============================================================================
+.. r2b-note::
 
-Requerimientos
---------------------------------------------------
+    2.5 min / 44 min
 
-SegÃºn paradigma
-~~~~~~~~~~~~~~~
-* ProgramaciÃ³n de bajo nivel
+Concurrencia - Problemas
+~~~~~~~~~~~~~~~~~~~~~~~~
+* Hilo que disparÃ³ la recolecciÃ³n bloqueado hasta fin de recolecciÃ³n completa
+  (marcado concurrente inclusive)
+* Otros hilos potencialmente bloqueados durante toda la recolecciÃ³n tambiÃ©n
+  (*lock* global)
 
-  * ``asm``
-  * ``union``
-  * ``extern (C)``
-  * ``malloc()``
+â Tiempo de pausa en la prÃ¡ctica ~= tiempo total de recolecciÃ³n
 
-  â Conservativo + ManipulaciÃ³n de *root set*
+.. r2b-note::
 
-* ProgramaciÃ³n de alto nivel â Python/Ruby/Perl
+    2.5 min / 46.5 min
 
-  * ``T[]``, ``T[K]``
+Concurrencia - Eager Allocation
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+* Crea un nuevo *pool* de memoria antes de lanzar el marcado concurrente
+* Devuelve memoria del nuevo *pool* al programa mientras termina el marcado
+  concurrente
+* Permite al programa (**todos** sus hilos) seguir trabajando mientras se
+  realiza el marcado concurrente
+* Compromiso
 
-  â Punteros interiores
+  â Consumo de memoria
 
-* OrientaciÃ³n a objetos â Java
+  â Tiempo de pausa real
 
-  * ``~this()``
+.. r2b-note::
 
-  â FinalizaciÃ³n
+    6.5 min / 53 min
 
+Concurrencia - Early Collection
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+* Dispara una recolecciÃ³n *preventiva* antes de que se agote la memoria
+* Permite al programa (**todos** sus hilos) seguir trabajando mientras la
+  recolecciÃ³n *preventiva* estÃ¡ en progreso
+* Si se agota la memoria antes de que la recolecciÃ³n *preventiva* finalice, se
+  vuelve a bloquear
+* Combinable con *eager allocation* para evitar bloquear
+* Pueden realizarse mÃ¡s recolecciones de las necesarias
+* Compromiso
 
-ImplementaciÃ³n Actual
---------------------------------------------------
+  â Consumo de procesador (potencialmente)
 
-OrganizaciÃ³n del heap
-~~~~~~~~~~~~~~~~~~~~~
-.. image:: img/heap.pdf
-    :height: 7cm
+  â Tiempo de pausa real (no garantizado)
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+.. r2b-note::
 
+    3.5 min / 56.5 min
 
-Lo Bueno, lo Malo y lo Feo
---------------------------------------------------
+    Si hago una recolecciÃ³n cuando queda 20% de memoria libre y nadie pide mÃ¡s
+    memoria mientras se recolecta, es como si tuviera 20% menos de memoria
+    disponible para el programa => mÃ¡s recolecciones => mÃ¡s consumo de CPU (y
+    potencialmente run-time)
 
-Diapositiva 1
+Otras Mejoras
 ~~~~~~~~~~~~~
-Diapositiva 1
+* Marcado semi-preciso del *heap*
+* Mejora del factor de ocupaciÃ³n del *heap*
+* CachÃ© de consultas crÃ­ticas para acelerar cuellos de botella
+* ReestructuraciÃ³n, modularizaciÃ³n, simplificaciÃ³n y limpieza del cÃ³digo
+* Pre-asignaciÃ³n de memoria
+* Optimizaciones algorÃ­tmicas sobre bÃºsquedas frecuentes
+* Registro de pedidos de memoria y recolecciones realizadas
+* Configurabilidad (en *tiempo de inicializaciÃ³n*)
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+.. r2b-note::
 
+    2 min / 58.5 min
 
 
-Modificaciones Propuestas
+
+Resultados
 ==============================================================================
 
-PrecisiÃ³n
+Resultados
 --------------------------------------------------
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+Tiempo MÃ¡ximo de Stop-The-World
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+.. image:: img/norm-hist-stw.pdf
+    :width: 12.5cm
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+.. r2b-note::
 
+    5.5 min / 67.5 min
 
-Concurrencia
---------------------------------------------------
+    Explicar brevemente divisiÃ³n de pruebas (cual es trivial, pequeÃ±a, real)
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+Tiempo MÃ¡ximo de Pausa Real
+~~~~~~~~~~~~~~~~~~~~~~~~~~~
+.. image:: img/norm-hist-pause.pdf
+    :width: 12.5cm
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+.. r2b-note::
 
+    2 min / 69.5 min
 
-Optimizaciones
---------------------------------------------------
+    Explicar que donde hay grandes diferencias, es por tiempo de barrido
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+Cantidad MÃ¡xima de Memoria Utilizada
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+.. image:: img/norm-hist-mem.pdf
+    :width: 12.5cm
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+.. r2b-note::
 
+    3.5 min / 73 min
 
+    Enganchar lo anterior con la relaciÃ³n con el consumo de memoria
 
-Resultados
-==============================================================================
+Tiempo Total de EjecuciÃ³n
+~~~~~~~~~~~~~~~~~~~~~~~~~
+.. image:: img/norm-hist-time.pdf
+    :width: 12.5cm
 
-Banco de Pruebas
---------------------------------------------------
+.. r2b-note::
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+    7 min / 80 min
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+    * mcore y split bajan mucho por cachÃ© de tamaÃ±o
+    * rnddata baja mucho por marcado preciso
+    * bigarr y sbtree suben porque no hacen mÃ¡s que alocar
 
 
-Tiempo de Stop-The-World
---------------------------------------------------
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+ConclusiÃ³n
+==============================================================================
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+ConclusiÃ³n
+--------------------------------------------------
 
+Resumen
+~~~~~~~
+* Objetivo principal
 
-Tiempo de Pausa Real
---------------------------------------------------
+  Minimizar tiempo de pausa para programas reales
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+  Tiempo de pausa de Dil:
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+  * *Stop-the-world* **160 veces menor** (1.66s â 0.01s)
+  * Pausa real **40 veces menor** (1.7s â 0.045s)
 
+* Objetivo secundario
 
-Tiempo de EjecuciÃ³n
---------------------------------------------------
+  No empeorar mucho el recolector actual en ningÃºn aspecto
 
-Diapositiva 1
-~~~~~~~~~~~~~
-Diapositiva 1
+  UtilizaciÃ³n de memoria de Dil:
 
-Diapositiva 2
-~~~~~~~~~~~~~
-Diapositiva 2
+  **50% mayor** (mucho *overhead* por marcado preciso)
 
+* Yapa
 
-ConclusiÃ³n
-==============================================================================
+  Tiempo total de ejecuciÃ³n de Dil:
 
-ConclusiÃ³n
---------------------------------------------------
+  Casi **3 veces menor** (55s â 20s)
 
-Resumen
-~~~~~~~
-* RecolecciÃ³n de basura â Inagotable
-* D â Multi-paradigma â DesafÃ­o
-* RecolecciÃ³n de basura en D â FÃ©rtil
-* Mejoras propuestas â Efectivas
-* Resultados â Positivos: Esperados + Inesperados
+.. r2b-note::
+
+    4 min / 84 min
 
-Problemas, limitaciones y Puntos Pendientes
+Problemas, Limitaciones y Puntos Pendientes
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-* PredicciÃ³n de *early collection*
 * ExplosiÃ³n de uso de memoria con *eager allocation*
+* Eficiencia del marcado preciso
+* Mejorar predicciÃ³n de *early collection*
 * Experimentar con ``clone(2)``
-* Eficiencia de marcado
+
+.. r2b-note::
+
+    3 min / 87 min
 
 Trabajos Relacionados
 ~~~~~~~~~~~~~~~~~~~~~
@@ -298,14 +312,27 @@ Trabajos Relacionados
   David Simcha (GC + diseÃ±o) y Vincent Lang (compilador). No formal, *bug
   report*, 2009-2010.
 
+* *Non-intrusive Cloning Garbage Collection with Stock Operating System Support*
+
+  Gustavo Rodriguez-Rivera y Vince Russo. Software Practiceand Experience
+  Volumen 27, NÃºmero 8.  Agosto 1997.
+
+.. r2b-note::
+
+    1.5 min / 88.5 min
+
 Trabajos Futuros
 ~~~~~~~~~~~~~~~~
 * OrganizaciÃ³n de memoria
 * Barrido
-* PrecisiÃ³n
+* \+ PrecisiÃ³n
 * Concurrencia â *Lock* **global**
 * Movimiento
 
+.. r2b-note::
+
+    1.5 min / 92 min
+
 Preguntas
 ~~~~~~~~~
 Â¿?
@@ -314,4 +341,5 @@ Fin
 ~~~
 Â¡Gracias!
 
+
 .. vim: set et sw=4 sts=4 spell spelllang=es :