X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/12b4722b4c418b9d60d75c0acdd9e5cac133af6a..8467f5df997cd28332cbd57ad5917b6bfb287365:/source/dgc.rst

diff --git a/source/dgc.rst b/source/dgc.rst
index 44b31d0..a457444 100644
--- a/source/dgc.rst
+++ b/source/dgc.rst
@@ -1368,7 +1368,73 @@ asignaciÃ³n de memoria.
 
 
 
-.. _dgc_problems:
+.. _dgc_good:
+
+CaracterÃ­sticas destacadas
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+Si bien el recolector en tÃ©rminos generales no se aleja mucho de un
+:ref:`marcado y barrido clÃ¡sico <gc_mark_sweep>`, tiene algunas mejoras por
+sobre el algoritmo mÃ¡s bÃ¡sicos que vale la pena destacar:
+
+
+OrganizaciÃ³n del *heap*
+^^^^^^^^^^^^^^^^^^^^^^^
+El *heap* estÃ¡ organizado de una forma que, si bien no emplea las tÃ©cnicas mÃ¡s
+modernas que pueden observarse en el estado del arte (como :ref:`regiones
+<gc_free_list>`), es relativamente sofisticada. El esquema de *pools*
+y bloques permite disminuir considerablemente los problemas de *fragmentaciÃ³n*
+de memoria y evita bÃºsquedas de *huecos* que pueden ser costosas (como
+*best-fit* [#dgcbestfit]_) o desperdiciar mucho especio (como *first-fit*
+[#dgcfirstfit]_), logrando un buen equilibrio entre velocidad y espacio
+desperdiciado.
+
+.. [#dgcbestfit] Las bÃºsquedas de tipo *best-fit* son aquellas donde se busca
+   el *hueco* en el *heap* (es decir, una regiÃ³n contÃ­nua de memoria
+   libre) que mejor se ajuste al tamaÃ±o del objeto a asignar. Es decir, el
+   *hueco* mÃ¡s pequeÃ±o lo suficientemente grande como para almacenarlo.
+
+.. [#dgcfirstfit] Las bÃºsquedas de tipo *first-fit* son aquellas donde se busca
+   el primer *hueco* en el *heap* (es decir, una regiÃ³n contÃ­nua de memoria
+   libre) que sea lo suficientemente grande como para almacenar el objeto
+   a asignar.
+
+
+Fase de marcado iterativa
+^^^^^^^^^^^^^^^^^^^^^^^^^
+A diferencia del algoritmo clÃ¡sico recursivo, el algoritmo del recolector
+actual es iterativo. El algoritmo recursivo tiene un problema fundamental: se
+puede llegar a un desbordamiento de pila (o *stack overflow*). La cantidad de
+recursiones necesarias es, en el peor caso, :math:`O(|Live \thickspace set|)`
+(por ejemplo, si todas las celdas del *heap* formaran una lista simplemente
+enlazada). Hay muchas tÃ©cnicas para lidiar con este problema, algunas que
+podrÃ­an aplicarse a D_ y otras que no (como *pointer reversal*) [JOLI96]_. El
+recolector actual, sin embargo, cambia complejidad en espacio por complejidad
+en tiempo, utilizando un algoritmo iterativo que es constante (:math:`O(1)`)
+en espacio, pero que requiere varias pasada sobre el *heap* en vez de una (la
+cantidad de pasadas es en el peor caso, al igual que la cantidad de
+recursiones del algoritmo recursivo, :math:`O(|Live \thickspace set|)`, pero
+cada pasada se realiza por sobre todo el *heap*).
+
+
+Conjuntos de bits para indicadores
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+El algoritmo clÃ¡scio propone almacenar en la propia celda la marca (para la
+fase de marcado) y otros indicadores. El algoritmo del recolector actual
+utiliza conjuntos de bits. Esto trae dos ventajas principales:
+
+* Permite minimizar el espacio requerido, ya que de otra forma en general se
+  desperdicia una palabra entera como cabecera de celda para guardar este tipo
+  de informaciÃ³n.
+
+* Mejora la localidad de referencia, ya que los indicadores se escriben de
+  forma muy compacta y en una regiÃ³n de memoria contÃ­gua que generalmente
+  puede entrar en el cache o en pocas pÃ¡ginas de memoria acelerando
+  considerablemente la fase de marcado.
+
+
+
+.. _dgc_bad:
 
 Problemas y limitaciones
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
@@ -1617,18 +1683,20 @@ Listas de libres:
   sin embargo solo tienen sentido los bloques de tamaÃ±o ``B_16`` a ``B_2048``,
   por lo que 4 de esas listas no se utilizan.
 
-Conjuntos de bits:
+Conjuntos de bits para indicadores:
   los indicadores para la fase de marcado y otras propiedades de un bloque son
   almacenados en conjuntos de bits que almacenan los indicadores de todos los
-  bloques de un *pool*. Como un *pool* tiene pÃ¡ginas con distintos tamaÃ±os de
-  bloque, se reserva una cantidad de bits igual a la mayor cantidad posible de
-  bloques que puede haber en el *pool*; es decir, se reserva 1 bit por cada 16
-  bytes del *pool*. Para un *pool* de 1 MiB (tamaÃ±o mÃ­nimo), teniendo en
-  cuenta que se utilizan 5 conjuntos de bits (``mark``, ``scan``, ``finals``,
-  ``freebits`` y ``noscan``), se utilizan 40 KiB de memoria para conjuntos de
-  bits (un 4% de *desperdicio* si, por ejemplo, ese *pool* estuviera destinado
-  por completo a albergar un solo objeto grande; lo que equivaldrÃ­a al 2560
-  objetos de 16 bytes desperdiciados en bits inutilizados).
+  bloques de un *pool*. Si bien se ha mencionado esto como una ventaja, hay
+  lugar todavÃ­a como para algunas mejoras. Como un *pool* tiene pÃ¡ginas con
+  distintos tamaÃ±os de bloque, se reserva una cantidad de bits igual a la
+  mayor cantidad posible de bloques que puede haber en el *pool*; es decir, se
+  reserva 1 bit por cada 16 bytes del *pool*. Para un *pool* de 1 MiB (tamaÃ±o
+  mÃ­nimo), teniendo en cuenta que se utilizan 5 conjuntos de bits (``mark``,
+  ``scan``, ``finals``, ``freebits`` y ``noscan``), se utilizan 40 KiB de
+  memoria para conjuntos de bits (un 4% de *desperdicio* si, por ejemplo, ese
+  *pool* estuviera destinado por completo a albergar un solo objeto grande; lo
+  que equivaldrÃ­a al 2560 objetos de 16 bytes desperdiciados en bits
+  inutilizados).
 
 RepeticiÃ³n de cÃ³digo:
    Hay algunos fragmentos de cÃ³digo repetidos inecesariamente. Por ejemplo en
@@ -1644,6 +1712,12 @@ Uso de seÃ±ales:
    seÃ±ales en sus programas (o peor aÃºn, si interactÃºan con bibliotecas
    de C que hacen uso de estas seÃ±ales) [NGD5821]_.
 
+Marcado iterativo:
+   si bien esto se mencionÃ³ como algo bueno del recolector actual, es un
+   compromiso entre tiempo y espacio, y puede ser interesante analizar otros
+   mÃ©todos para evitar la recursiÃ³n que no requieran tantas pasadas sobre el
+   *heap*.
+
 
 .. include:: links.rst