X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/93304243d72347314f0d9c402a0632ab50550016..fe08991bc0d4322fa06b341bf99f01b23a8357ac:/source/solucion.rst

diff --git a/source/solucion.rst b/source/solucion.rst
index fe9086b..2cd924c 100644
--- a/source/solucion.rst
+++ b/source/solucion.rst
@@ -1,8 +1,4 @@
 
-.. AcÃ¡ va lo que decidÃ­ hacer en base al anÃ¡lisis anterior y sus razones.
-   ESTADO: TERMINADO
-
-
 .. _solucion:
 
 SoluciÃ³n adoptada
@@ -38,6 +34,8 @@ se intenta abordar los demÃ¡s problemas planteados siempre que sea posible
 hacerlo sin alejarse demasiado del objetivo principal.
 
 
+.. highlight:: d
+
 .. _sol_bench:
 
 Banco de pruebas
@@ -60,10 +58,10 @@ noticias de D_ [#benchmod]_) programas triviales sintetizados con el Ãºnico
 propÃ³sito de mostrar problemas con el recolector de basura. Otros programas de
 este estilo fueron escritos explÃ­citamente para este trabajo.
 
-AdemÃ¡s se han recolectado [#benchmod]_ algunos pequeÃ±os programas portados de
-otros lenguajes de programaciÃ³n, que si bien son pequeÃ±os y tienen como
-objetivo ejercitar el recolector de basura, son programas reales que resuelven
-un problema concreto, lo que otorga un juego de pruebas un poco mÃ¡s amplio que
+AdemÃ¡s se han recolectado algunos pequeÃ±os programas portados de otros
+lenguajes de programaciÃ³n, que si bien son pequeÃ±os y tienen como objetivo
+ejercitar el recolector de basura, son programas reales que resuelven un
+problema concreto, lo que otorga un juego de pruebas un poco mÃ¡s amplio que
 los programas triviales.
 
 .. [#benchmod] Cabe destacar que en general todos los programas recolectados
@@ -103,9 +101,9 @@ originalmente fue concebido para mostrar un problema con la concatenaciÃ³n de
 arreglos (como se aprecia en la sentencia ``version(loseMemory)``), ejercita
 los aspectos mÃ¡s utilizados del del recolector: manipulaciÃ³n de arreglos
 y peticiÃ³n e memoria. Es una de las pruebas que mÃ¡s estresa al recolector ya
-que todo el trabajo que realiza el programa es utilizar servicios de Ã©ste.
+que todo el trabajo que realiza el programa es utilizar sus servicios.
 
-El cÃ³digo fuente del programa es el siguiente::
+CÃ³digo fuente::
 
    const IT = 300;
    const N1 = 20_000;
@@ -130,7 +128,6 @@ El cÃ³digo fuente del programa es el siguiente::
 
    int main(char[][] args)
    {
-
       Population testPop1 = new Population;
       Population testPop2 = new Population;
       Individual[N2] indi;
@@ -141,8 +138,8 @@ El cÃ³digo fuente del programa es el siguiente::
             indi[] = testPop1.individuals ~ testPop2.individuals;
          }
          version (everythingOk) {
-            indi[0..N1] = testPop1.individuals;
-            indi[N1..N2] = testPop2.individuals;
+            indi[0 .. N1] = testPop1.individuals;
+            indi[N1 .. N2] = testPop2.individuals;
          }
       }
       return 0;
@@ -164,8 +161,8 @@ El objetivo de estos programas es medir el impacto de las pausas del
 recolector. Se espera medir dos tipos de pausa principales, por un lado el
 tiempo mÃ¡ximo de pausa real, que puede involucrar a mÃ¡s de un hilo y por otro
 el tiempo de *stop-the-world*, es decir, el tiempo en que los hilos son
-efectivamente pausados por el recolector para tomar una *foto* de la pila
-y registros para agregarlos al *root set*.
+efectivamente pausados por el recolector para realizar una tarea que necesite
+trabajar con una versiÃ³n estÃ¡tica de la memoria del programa.
 
 Se espera ``concpu`` sea capaz de explotar cualquier reducciÃ³n en el tiempo de
 *stop-the-world*, ya que los hilos solo son interrumpidos por este tipo de
@@ -174,7 +171,7 @@ mÃ¡ximo de pausa, que podrÃ­an sufrir los hilos incluso cuando el *mundo* sigue
 su marcha, debido al *lock* global del recolector y que los hilos usan
 servicios de Ã©ste.
 
-El cÃ³digo de ``concpu`` es el siguiente::
+CÃ³digo fuente de ``concpu``::
 
    import tango.core.Thread: Thread;
    import tango.core.Atomic: Atomic;
@@ -269,8 +266,8 @@ servicios del recolector, por lo tanto un programa multi-hilo en el cual los
 hilos (aparentemente) no comparten ningÃºn estado, se puede ver
 considerablemente afectado por el recolector (siendo este efecto mÃ¡s visible
 en ambientes *multi-core* por el nivel de sincronizaciÃ³n extra que significa
-a nivel de *hardware*). Cabe destacar que, sin embargo, en Linux_ no es tan
-notorio.
+a nivel de *hardware*). Cabe destacar, sin embargo, que en Linux_ el efecto no
+es tan notorio comparado al reporte de David Schima.
 
 
 ``split``
@@ -282,7 +279,7 @@ mostrar lo ineficiente que puede ser concatenar datos a un mismo arreglo
 repetidas veces y ha desembocado en una pequeÃ±a optimizaciÃ³n que sirviÃ³ para
 paliar el problema de forma razonablemente efectiva [PAN09]_.
 
-El cÃ³digo es el siguiente::
+CÃ³digo fuente::
 
    import tango.io.device.File: File;
    import tango.text.Util: delimit;
@@ -309,12 +306,12 @@ __ http://www.digitalmars.com/webnews/newsgroups.php?art_group=digitalmars.D&art
 Este programa fue escrito por Oskar Linde y nuevamente hallado__ en el grupo
 de noticias. Fue construido para mostrar como el hecho de que el recolector
 sea conservativo puede hacer que al leer datos binarios hayan muchos *falsos
-punteros* que mantengan vivas celdas que en realidad ya no deberÃ­an ser
+positivos* que mantengan vivas celdas que en realidad ya no deberÃ­an ser
 accesibles desde el *root set* del grafo de conectividad.
 
 __ http://www.digitalmars.com/webnews/newsgroups.php?art_group=digitalmars.D&article_id=46407
 
-El cÃ³digo del programa es el siguiente::
+CÃ³digo fuente::
 
    import tango.math.random.Random;
 
@@ -351,8 +348,8 @@ El cÃ³digo del programa es el siguiente::
 Este programa estÃ¡ basado en la prueba de nombre ``binary-trees`` de `The
 Computer Language Benchmarks Game`__, una colecciÃ³n de 12 programas escritos
 en alrededor de 30 lenguajes de programaciÃ³n para comparar su eficiencia
-(medida en tiempo de ejecuciÃ³n, uso de memoria y cantidad de lÃ­neas de
-cÃ³digo). De este juego de programas se utilizÃ³ solo ``binary-trees`` por ser
+(medida en tiempo de ejecuciÃ³n, uso de memoria y cantidad de lÃ­neas de cÃ³digo)
+[SHO10]_. De este juego de programas se utilizÃ³ solo ``binary-trees`` por ser
 el Ãºnico destinado a ejercitar el manejo de memoria. El programa sÃ³lo manipula
 Ã¡rboles binarios, creÃ¡ndolos y recorriÃ©ndolos inmediatamente (no realiza
 ningÃºn trabajo Ãºtil). La traducciÃ³n a D_ fue realizada por Andrey Khropov
@@ -361,7 +358,7 @@ y fue hallada__ en el grupo de noticias.
 __ http://shootout.alioth.debian.org/
 __ http://www.digitalmars.com/webnews/newsgroups.php?art_group=digitalmars.D&article_id=43991
 
-El cÃ³digo fuente es el siguiente::
+CÃ³digo fuente::
 
    import tango.util.Convert;
    alias char[] string;
@@ -428,9 +425,9 @@ distribuida. Son programas relativamente pequeÃ±os (entre 400 y 1000 lÃ­neas de
 cÃ³digo fuente cada uno) que realizan una tarea secuencial que asigna
 estructuras de datos dinÃ¡micamente. Las estructuras estÃ¡n usualmente
 organizadas como listas o Ã¡rboles, y muy raramente como arreglos. Los
-programas pasan la mayor parte del tiempo alocando datos y el resto usando los
-datos alocados, por lo que en general estÃ¡n acotados en tiempo por el uso de
-memoria (y no de procesador).
+programas pasan la mayor parte del tiempo solicitando memoria para almacenar
+datos y el resto usando los datos almacenados, por lo que en general estÃ¡n
+acotados en tiempo por el uso de memoria (y no de procesador).
 
 __ http://www.irisa.fr/caps/people/truong/M2COct99/Benchmarks/Olden/Welcome.html
 __ http://www.martincarlisle.com/olden.html
@@ -443,7 +440,7 @@ propÃ³sito, como DaCapo__ [BLA06]_, sin embargo, dada la falta de programas
 disponibles en general, y de un conjunto de pruebas especialmente diseÃ±ado
 para evaluar el recolector de basura en D_, se decide utilizarlas en este
 trabajo de todos modos. Sin embargo sus resultados deben ser interpretados con
-una pizca de sal por lo mencionado anteriormente.
+una pizca de suspicacia por lo mencionado anteriormente.
 
 __ http://www-ali.cs.umass.edu/DaCapo/benchmarks.html
 __ http://www.dacapobench.org/
@@ -524,8 +521,8 @@ GPL_) es, lamentablemente, el Ãºnico programa real hallado que, a pesar de
 estar incompleto, es lo suficientemente grande, mantenido y estable como para
 ser incluido en el banco de pruebas. Se trata de un compilador de D_ escrito
 en D_ y estÃ¡ incompleto porque no puede generar cÃ³digo (falta implementar el
-anÃ¡lisis semÃ¡ntico y la generaciÃ³n de cÃ³digo), por lo que es principalmente
-utilizado para generar documentaciÃ³n a partir del cÃ³digo.
+anÃ¡lisis semÃ¡ntico y la generaciÃ³n de cÃ³digo). Es principalmente utilizado
+para generar documentaciÃ³n a partir del cÃ³digo.
 
 El programa estÃ¡ compuesto por:
 
@@ -544,10 +541,10 @@ objetos extremadamente pequeÃ±os y de tamaÃ±os poco convencionales (no mÃºltiplo
 de palabras, por ejemplo). A su vez, el texto interpretado es convertido a una
 representaciÃ³n interna en forma de Ã¡rbol (o *Ã¡rbol de sintaxis abstracta*)
 modelado por tipos *livianos* y polimÃ³rficos que estÃ¡n organizados en arreglos
-dinÃ¡micos contiguos y asociativos (que usan muchos servicios del recolector),
-y que finalmente son manipulados para obtener y generar la informaciÃ³n
-necesaria, creando y dejando *morir* objetos constantemente (pero no como Ãºnica
-forma de procesamiento, como otras pruebas sintetizadas).
+dinÃ¡micos contiguos y asociativos (que usan muchos servicios del recolector).
+Finalmente estos objetos son manipulados para obtener y generar la informaciÃ³n
+necesaria, creando y dejando de usar objetos constantemente (pero no como
+Ãºnica forma de procesamiento, como otras pruebas sintetizadas).
 
 Por Ãºltimo, a diferencia de muchos otros programas escritos en D_, que dadas
 algunas de las ineficiencias del recolector invierten mucho trabajo en limitar
@@ -562,6 +559,8 @@ ser Ãºtiles para encontrar problemas muy particulares, estÃ¡ es la que da una
 lectura mÃ¡s cercana a la realidad del uso de un recolector.
 
 
+.. highlight:: pcode
+
 .. _sol_mod:
 
 Modificaciones propuestas
@@ -621,11 +620,11 @@ tedioso y complejo, ademÃ¡s ineficiente, por lo tanto esta opciÃ³n tambiÃ©n se
 descarta.
 
 Finalmente, lo que parece ser mÃ¡s apropiado para un recolector, es permitir la
-configuraciÃ³n en tiempo de inicializaciÃ³n. Es decir, configurar el recolectar
-sin necesidad de recompilar ni el programa del usuario ni el recolector, pero
-antes de que el programa del usuario inicie, de manera que una vez iniciado el
-recolector con ciertos parÃ¡metros, Ã©stos no cambien nunca mÃ¡s en durante la
-vida del programa.
+configuraciÃ³n en *tiempo de inicializaciÃ³n*. Es decir, configurar el
+recolectar sin necesidad de recompilar ni el programa del usuario ni el
+recolector, pero antes de que el programa del usuario inicie, de manera que
+una vez iniciado el recolector con ciertos parÃ¡metros, Ã©stos no cambien nunca
+mÃ¡s en durante la vida del programa.
 
 Este esquema provee la mejor relaciÃ³n entre configurabilidad, conveniencia,
 eficiencia y simplicidad. Una posibilidad para lograr esto es utilizar
@@ -664,7 +663,7 @@ interpretado de la siguiente manera (en formato similar a :term:`BNF`):
    name: `namec` `namec`*                <nombre de la opciÃ³n>
    value: `valuec`*                      <valor de la opciÃ³n>
    namec: `valuec` - '='
-   valuec: [0x01-0xFF] - ':'             <cualquier char salvo '\0' y ':'>
+   valuec: [0x01-0xFF] - ':'             <cualquiera salvo '\0' y ':'>
 
 Es decir, se compone de una lista de opciones separadas por **:**. Cada opciÃ³n
 se especifica con un nombre, opcionalmente seguido por un valor (separados por
@@ -698,53 +697,53 @@ el formato del valor de la opciÃ³n de tener uno especial):
    nÃºmero, se crea un *pool* con ese tamaÃ±o en MiB.  Si, en cambio, se
    especifica una cadena del tipo ``3x1``, el primer nÃºmero indica la cantidad
    de *pools* y el segundo el tamaÃ±o en MiB de cada uno (3 *pools* de 1MiB en
-   este caso). Ver :ref:`sol_pre_alloc` para mÃ¡s detalles sobre la utilidad de
-   esta opciÃ³n.
+   este caso). Ver :ref:`sol_pre_alloc` mÃ¡s adelante para mÃ¡s detalles sobre
+   la utilidad de esta opciÃ³n.
 
 ``min_free``
-   El valor de esta opciÃ³n indica el porcentaje mÃ­nimo porcentaje del *heap*
-   que debe quedar libre luego de una recolecciÃ³n. Siendo un porcentaje, solo
-   se aceptan valores entre 0 y 100, siendo su valor por omisiÃ³n 5. Ver
-   :ref:`sol_ocup` para mÃ¡s detalles sobre su propÃ³sito.
+   El valor de esta opciÃ³n indica el porcentaje mÃ­nimo del *heap* que debe
+   quedar libre luego de una recolecciÃ³n. Siendo un porcentaje, solo se
+   aceptan valores entre 0 y 100, siendo su valor por omisiÃ³n 5. Ver
+   :ref:`sol_ocup` mÃ¡s adelante para mÃ¡s detalles sobre su propÃ³sito.
 
 ``malloc_stats_file``
    Esta opciÃ³n sirve para especificar un archivo en el cual escribir un
    reporte de todas la operaciones de pedido de memoria realizadas por el
-   programa (durante su tiempo de vida).  Ver :ref:`sol_stats` para mÃ¡s
-   detalles sobre la informaciÃ³n provista y el formato del reporte.
+   programa (durante su tiempo de vida).  Ver :ref:`sol_stats` mÃ¡s adelante
+   para mÃ¡s detalles sobre la informaciÃ³n provista y el formato del reporte.
 
 ``collect_stats_file``
    Esta opciÃ³n sirve para especificar un archivo en el cual escribir un
    reporte de todas las recolecciones hechas durante el tiempo de vida del
-   programa.  Ver :ref:`sol_stats` para mÃ¡s detalles sobre la informaciÃ³n
-   provista y el formato del reporte.
+   programa.  Ver :ref:`sol_stats` mÃ¡s adelante para mÃ¡s detalles sobre la
+   informaciÃ³n provista y el formato del reporte.
 
 ``conservative``
    Esta opciÃ³n booleana permite desactivar el escaneo preciso del *heap*,
    forzando al recolector a ser completamente conservativo (excepto por los
    bloques con el atributo ``NO_SCAN`` que siguen sin ser escaneados). Ver
-   :ref:`sol_precise` para mÃ¡s detalles sobre la existencia de esta opciÃ³n.
+   :ref:`sol_precise` mÃ¡s adelante para mÃ¡s detalles sobre la existencia de esta opciÃ³n.
 
 ``fork``
    Esta opciÃ³n booleana (activada por omisiÃ³n) permite seleccionar si el
    recolector debe correr la fase de marcado en paralelo o no (es decir, si el
    recolector corre de forma concurrente con el *mutator*).  Para mÃ¡s detalles
-   ver :ref:`sol_fork`.
+   ver :ref:`sol_fork` mÃ¡s adelante.
 
 ``eager_alloc``
    Esta opciÃ³n booleana (activada por omisiÃ³n), sÃ³lo puede estar activa si
-   ``fork`` tambiÃ©n estÃ¡ activa y sirve para indicar al recolector que reserve
-   un nuevo *pool* de memoria cuando una peticiÃ³n no puede ser satisfecha,
-   justo antes de lanzar la recolecciÃ³n concurrente. Ver
-   :ref:`sol_eager_alloc` para mÃ¡s detalles sobre el propÃ³sito de esta opciÃ³n.
+   ``fork`` tambiÃ©n lo estÃ¡ y sirve para indicar al recolector que reserve un
+   nuevo *pool* de memoria cuando una peticiÃ³n no puede ser satisfecha, justo
+   antes de lanzar la recolecciÃ³n concurrente. Ver :ref:`sol_eager_alloc` mÃ¡s
+   adelante para mÃ¡s detalles sobre el propÃ³sito de esta opciÃ³n.
 
 ``early_collect``
    Esta opciÃ³n booleana (desactivada por omisiÃ³n), tambiÃ©n sÃ³lo puede estar
    activa si ``fork`` estÃ¡ activa y sirve para indicar al recolector que lance
    una recolecciÃ³n (concurrente) antes de que la memoria libre se termine (la
    recolecciÃ³n temprana serÃ¡ disparada cuando el porcentaje de memoria libre
-   sea menor a ``min_free``). Ver :ref:`sol_early_collect` para mÃ¡s detalles
-   sobre el propÃ³sito de esta opciÃ³n.
+   sea menor a ``min_free``). Ver :ref:`sol_early_collect` mÃ¡s adelante para
+   mÃ¡s detalles sobre el propÃ³sito de esta opciÃ³n.
 
 Cualquier opciÃ³n o valor no reconocido es ignorado por el recolector. Se
 utilizan los valores por omisiÃ³n de las opciones que no fueron especificadas,
@@ -756,7 +755,7 @@ shell*):
 
 .. code-block:: none
 
-   D_GC_OPTS=conservative:eager_alloc=0:early_collect=1:pre_alloc=2x5 ./programa
+   D_GC_OPTS=conservative:eager_alloc=0:early_collect=1:pre_alloc=2x5 ./prog
 
 En este ejemplo, se activan las opciones ``conservative`` y ``early_collect``,
 se desactiva ``eager_alloc`` y se crean 2 *pools* de 5MiB cada uno al
@@ -848,14 +847,13 @@ Mejora del factor de ocupaciÃ³n del *heap*
 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
 El factor de ocupaciÃ³n del *heap* debe ser apropiado por dos razones. Por un
 lado, si el *heap* estÃ¡ demasiado ocupado todo el tiempo, serÃ¡n necesarias
-muchas recolecciones que, aunque pequeÃ±as dado que la memoria utilizada es
-poca, puede llegar a ser extremadamente ineficiente en casos patolÃ³gicos (ver
-:ref:`dgc_bad_ocup`). Por otro lado, si el tamaÃ±o del *heap* es extremadamente
-grande (en comparaciÃ³n con el tamaÃ±o real del grupo de trabajo del programa),
-se harÃ¡n pocas recolecciones pero cada una es muy costosa, porque el algoritmo
-de marcado y barrido es :math:`O(\lvert Heap \rvert)` (ver
-:ref:`gc_mark_sweep`). AdemÃ¡s la afinidad del cachÃ© va a ser extremadamente
-pobre.
+muchas recolecciones, lo que puede llegar a ser extremadamente ineficiente en
+casos patolÃ³gicos (ver :ref:`dgc_bad_ocup`). Por otro lado, si el tamaÃ±o del
+*heap* es extremadamente grande (en comparaciÃ³n con el tamaÃ±o real del grupo
+de trabajo del programa), se harÃ¡n pocas recolecciones pero cada una es muy
+costosa, porque el algoritmo de marcado y barrido es :math:`O(\lvert Heap
+\rvert)` (ver :ref:`gc_mark_sweep`). AdemÃ¡s la afinidad del cachÃ© va a ser
+extremadamente pobre.
 
 Para mantener el factor de ocupaciÃ³n dentro de lÃ­mites razonables, se agrega
 la opciÃ³n ``min_free`` (ver :ref:`sol_config_spec`). Esta opciÃ³n indica el
@@ -882,8 +880,9 @@ complejidad agregada.
 Probablemente el caso mÃ¡s significativo, y por tanto el Ãºnico que vale la pena
 mencionar, es la conversiÃ³n de marcado iterativo a marcado recursivo y luego
 a un esquema hÃ­brido. Como se describe en :ref:`dgc_bad`, el marcado iterativo
-tiene sus ventajas, pero tiene desventajas tambiÃ©n. Al convertirlo a puramente
-recursivo, se impracticable por resultar en errores de desbordamiento de pila.
+tiene sus ventajas, pero tiene desventajas tambiÃ©n. La conversiÃ³n a puramente
+recursivo resulta impracticable dado que desemboca en errores de
+desbordamiento de pila.
 
 Por lo tanto se prueba con un esquema hÃ­brido, poniendo un lÃ­mite a la
 recursividad, volviendo al algoritmo iterativo cuando se alcanza este lÃ­mite.
@@ -924,17 +923,17 @@ sobre el algoritmo original (ver :ref:`dgc_algo_mark`)::
 
 Al analizar los resultados de de esta modificaciÃ³n, se observa una mejorÃ­a muy
 level, para valores de ``MAX_DEPTH`` mayores a cero (en algunos casos bastante
-mayores) y en general para ``MAX_DEPTH`` cero (es decir, usando el algoritmo
-de forma completamente iterativa) los resultados son peores, dado que se paga
-el trabajo extra sin ganancia alguna. En la figura :vref:`fig:sol-mark-rec` se
+mayores). En general para ``MAX_DEPTH`` cero (es decir, usando el algoritmo de
+forma completamente iterativa) los resultados son peores, dado que se paga el
+trabajo extra sin ganancia alguna. En la figura :vref:`fig:sol-mark-rec` se
 puede ver, por ejemplo, el tiempo total de ejecuciÃ³n de Dil_ al generar la
 documentaciÃ³n completa del cÃ³digo de Tango_, segÃºn varÃ­a el valor de
 ``MAX_DEPTH``.
 
-.. fig:: fig:sol-mark-rec
+.. flt:: fig:sol-mark-rec
 
    AnÃ¡lisis de tiempo total de ejecuciÃ³n en funciÃ³n del valor de
-   ``MAX_DEPTH``.
+   ``MAX_DEPTH``
 
    Tiempo total de ejecuciÃ³n de Dil_ al generar la documentaciÃ³n completa del
    cÃ³digo de Tango_ en funciÃ³n del valor de ``MAX_DEPTH``. El rombo no
@@ -950,7 +949,7 @@ programa que estÃ© al borde de consumir todo el *stack*, el recolector podrÃ­a
 hacer fallar al programa de una forma inesperada para el usuario, problema que
 serÃ­a muy difÃ­cil de depurar para Ã©ste), y que los resultados obtenidos no son
 rotundamente superiores a los resultados sin esta modificaciÃ³n, se opta por no
-incluir este cambio. Tampoco vale la pena incluirlo como una opciÃ³n con valor
+incluir el cambio. Tampoco vale la pena incluirlo como una opciÃ³n con valor
 por omisiÃ³n 0 porque, como se ha dicho, para este caso el resultado es incluso
 peor que sin la modificaciÃ³n.
 
@@ -971,8 +970,8 @@ recolecciÃ³n de estadÃ­sticas. Hay muchos aspectos que pueden ser analizados
 a la hora de evaluar un recolector, y es por esto que se busca que la
 recolecciÃ³n de datos sea lo mÃ¡s completa posible.
 
-Con este objetivo, se decide recolectar datos sobre lo que, probablemente,
-sean las operaciones mÃ¡s importantes del recolector: asignaciÃ³n de memoria
+Con este objetivo, se decide recolectar datos sobre lo que probablemente sean
+las operaciones mÃ¡s importantes del recolector: asignaciÃ³n de memoria
 y recolecciÃ³n.
 
 Todos los datos recolectados son almacenados en archivos que se especifican
@@ -1028,7 +1027,7 @@ interÃ©s para analizar como se comporta el recolector.
 
 El punto 8 es completamente inÃºtil, ya que el compilador nunca provee esta
 informaciÃ³n, pero se la deja por si en algÃºn momento comienza a hacerlo. Los
-puntos 9 a 12 provee informaciÃ³n sobre el tipo del objeto almacenado, Ãºtil
+puntos 9 a 12 proveen informaciÃ³n sobre el tipo del objeto almacenado, Ãºtil
 para un marcado preciso (ver :ref:`sol_precise`).
 
 El punto 6 indica, indirectamente, cuales de los objetos asignados son
@@ -1050,12 +1049,12 @@ recolecciÃ³n [#solcollect]_ (es decir, cada vez que se llama a la funciÃ³n
    *stop-the-world*).
 5. Cantidad de memoria usada antes de la recolecciÃ³n.
 6. Cantidad de memoria libre antes de la recolecciÃ³n.
-7. Cantidad de memoria desperdiciada antes de la recolecciÃ³n.
+7. Cantidad de memoria desperdiciada [#solwaste]_ antes de la recolecciÃ³n.
 8. Cantidad de memoria utilizada por el mismo recolector antes de la
    recolecciÃ³n (para sus estructuras internas).
 9. Cantidad de memoria usada despuÃ©s de la recolecciÃ³n.
 10. Cantidad de memoria libre despuÃ©s de la recolecciÃ³n.
-11. Cantidad de memoria desperdiciada [#solwaste]_ despuÃ©s de la recolecciÃ³n.
+11. Cantidad de memoria desperdiciada despuÃ©s de la recolecciÃ³n.
 12. Cantidad de memoria utilizada por el mismo recolector despuÃ©s de la
     recolecciÃ³n.
 
@@ -1085,11 +1084,11 @@ Marcado preciso
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
 Para agregar el soporte de marcado preciso se aprovecha el trabajo realizado
-por Vincent Lang (ver :ref:`dgc_via_art`) [DBZ3463]_, dado que se basa en `D
-1.0`_ y Tango_, al igual que este trabajo. Dado el objetivo y entorno comÃºn,
-se abre la posibilidad de adaptar sus cambios a este trabajo, utilizando una
-versiÃ³n modificada de DMD_ (dado que los cambios aÃºn no son integrados al
-compilador oficial).
+por Vincent Lang (ver :ref:`dgc_via_art`) [DBZ3463]_, gracias a que se basa en
+`D 1.0`_ y Tango_, al igual que este trabajo. Dado el objetivo y entorno
+comÃºn, se abre la posibilidad de adaptar sus cambios a este trabajo,
+utilizando una versiÃ³n modificada de DMD_ (dado que los cambios aÃºn no estÃ¡n
+integrados al compilador oficial todavÃ­a).
 
 .. TODO: ApÃ©ndice con parches a DMD y Tango?
 
@@ -1101,9 +1100,10 @@ memoria. Esta informaciÃ³n se pasa como un puntero a un arreglo de palabras con
 la estructura mostrada en la figura :vref:`fig:sol-ptrmap` y que se describe
 a continuaciÃ³n.
 
-.. fig:: fig:sol-ptrmap
+.. flt:: fig:sol-ptrmap
+   :type: table
 
-   Estructura de la informaciÃ³n de tipos provista por el compilador.
+   Estructura de la informaciÃ³n de tipos provista por el compilador
 
    .. aafig::
       :scale: 110
@@ -1133,7 +1133,9 @@ a continuaciÃ³n.
 
 Los conjuntos de bits guardan la informaciÃ³n sobre la primera palabra en el
 bit menos significativo. Dada la complejidad de la representaciÃ³n, se ilustra
-con un ejemplo. Dada la estructura::
+con un ejemplo. Dada la estructura:
+
+.. code-block:: d
 
    union U {
       ubyte ub;
@@ -1163,9 +1165,9 @@ palabra sea realmente un puntero, pero indica que debe ser escaneado. El
 recolector debe debe ser conservativo en este caso, y escanear esa palabra
 como si fuera un puntero.
 
-.. fig:: fig:sol-ptrmap-example
+.. flt:: fig:sol-ptrmap-example
 
-   Ejemplo de estructura de informaciÃ³n de tipos generada para el tipo ``S``.
+   Ejemplo de estructura de informaciÃ³n de tipos generada para el tipo ``S``
 
    .. aafig::
       :textual:
@@ -1223,10 +1225,10 @@ ese caso no hace falta directamente escanear ninguna palabra del bloque.
 En la figura :vref:`fig:sol-ptrmap-blk` se puede ver, como continuaciÃ³n del
 ejemplo anterior, como se almacenarÃ­a en memoria un objeto del tipo ``S``.
 
-.. fig:: fig:sol-ptrmap-blk
+.. flt:: fig:sol-ptrmap-blk
 
    Ejemplo de bloque que almacena un objeto de tipo ``S`` con informaciÃ³n de
-   tipo.
+   tipo
 
    .. aafig::
       :scale: 110
@@ -1252,7 +1254,7 @@ objeto ocuparÃ¡ el doble de memoria.
 El algoritmo de marcado se cambia de la siguiente forma::
 
    // Agregado
-   global conservative_scan = [1, 1, 0]
+   global conservative_ptrmap = [1, 1, 0]
 
    // Agregado
    function must_scan_word(pos, bits) is
@@ -1264,7 +1266,7 @@ El algoritmo de marcado se cambia de la siguiente forma::
       pointer = begin
       while pointer < end
          foreach word_pos in 0..number_of_words_in_type   //
-            if not must_scan_word(n, scan_bits)           // Agregado
+            if not must_scan_word(word_pos, scan_bits)    // Agregado
                continue                                   //
             [pool, page, block] = find_block(pointer)
             if block is not null and block.mark is false
@@ -1289,7 +1291,7 @@ El algoritmo de marcado se cambia de la siguiente forma::
                         else // objeto pequeÃ±o                   //
                            begin = block.begin                   //
                            end = block.end                       // Modificado
-                        ptrmap = global conservative_scan        //
+                        ptrmap = global conservative_ptrmap      //
                         if NO_SCAN not in block.attrs            //
                            end -= size_t.sizeof                  //
                            ptrmap = cast(size_t*) *end           //
@@ -1297,17 +1299,17 @@ El algoritmo de marcado se cambia de la siguiente forma::
 
    function mark_static_data() is
       mark_range(static_data.begin, static_data.end,
-            global conservative_scan)                // Agregado
+            global conservative_ptrmap)              // Agregado
 
    function mark_stacks() is
       foreach thread in threads
          mark_range(thread.stack.begin, thread.stack.end,
-               global conservative_scan)                  // Agregado
+               global conservative_ptrmap)                // Agregado
 
    function mark_user_roots() is
       foreach root_range in user_roots
          mark_range(root_range.begin, root_range.end,
-               global conservative_scan)              // Agregado
+               global conservative_ptrmap)            // Agregado
 
 Las funciones de asignaciÃ³n de memoria se modifican de forma similar, para
 guardar el puntero a la informaciÃ³n de tipos. Esta implementaciÃ³n utiliza solo
@@ -1385,7 +1387,7 @@ puede ser muy eficiente, y la copia de memoria es proporcional a la cantidad
 de cambios que hayan.
 
 :manpage:`fork(2)` tiene otra propiedad importante de mencionar: detiene todos
-los hilos de ejecuciÃ³n en el proceso hijo. Es decir, el proceso hijo se crear
+los hilos de ejecuciÃ³n en el proceso hijo. Es decir, el proceso hijo se crea
 con un solo hilo (el hilo que ejecutÃ³ la operaciÃ³n de :manpage:`fork(2)`).
 
 Algoritmo
@@ -1394,7 +1396,7 @@ Lo que propone el algoritmo es muy sencillo, utilizar la llamada al sistema
 :manpage:`fork(2)` para crear una *fotografÃ­a* de la memoria del proceso en un
 nuevo proceso. En el proceso padre sigue corriendo el *mutator* y en el
 proceso hijo se corre la fase de marcado. El *mutator* puede modificar el
-grafo de conectividad pero los cambios quedan aislados el hijo (el marcado),
+grafo de conectividad pero los cambios quedan aislados del hijo (el marcado),
 que tiene una visiÃ³n consistente e inmutable de la memoria. El sistema
 operativo duplica las pÃ¡ginas que modifica el padre bajo demanda, por lo tanto
 la cantidad de memoria fÃ­sica realmente copiada es proporcional a la cantidad
@@ -1409,17 +1411,16 @@ se preserva:
 Es decir, el *mutator* no puede *resucitar* una celda *muerta* y esta
 invariante se mantiene al correr la fase de marcado sobre una vista inmutable
 de la memoria. El Ãºnico efecto introducido es que el algoritmo toma una
-aproximaciÃ³n mÃ¡s conservativa. Es decir, lo que sÃ­ puede pasar es que una
-celda que pasÃ³ a estar *muerta* una vez que la fase de marcado se iniciÃ³, pero
-antes de que Ã©sta termine, la celda no se reciclarÃ¡ hasta la prÃ³xima
-recolecciÃ³n, dado que este algoritmo no incluye una comunicaciÃ³n entre
-*mutator* y recolector para notificar cambios en el grafo de conectividad.
-Pero esto no afecta la correcciÃ³n del algoritmo, ya que un recolector es
-correcto cuando nunca recicla celdas *vivas*.
+aproximaciÃ³n mÃ¡s conservativa; una celda que pasÃ³ a estar *muerta* luego de
+que se inicie la fase de marcado, pero antes de que termine, puede no ser
+reciclada hasta la prÃ³xima recolecciÃ³n, dado que este algoritmo no incluye una
+comunicaciÃ³n entre *mutator* y recolector para notificar cambios en el grafo
+de conectividad. Pero esto no afecta la correcciÃ³n del algoritmo, ya que un
+recolector es correcto cuando nunca recicla celdas *vivas*.
 
 La Ãºnica comunicaciÃ³n necesaria entre el *mutator* y el recolector son los
 bits de marcado (ver :ref:`dgc_impl`), dado que la fase de barrido debe correr
-en el proceso padre. No es necesaria ningÃºn tipo de sincronizaciÃ³n entre
+en el proceso padre. No es necesario ningÃºn tipo de sincronizaciÃ³n entre
 *mutator* y recolector mÃ¡s allÃ¡ de que uno espera a que el otro finalice.
 
 AdemÃ¡s de almacenar el conjunto de bits ``mark`` en memoria compartida entre
@@ -1517,8 +1518,8 @@ ser las siguientes::
             sweep()                             //
          return                                 //
       stop_the_world()
-      child_pid = fork()
       fflush(null)
+      child_pid = fork()
       if child_pid is 0 // proceso hijo
          mark_phase()
          exit(0)
@@ -1581,7 +1582,7 @@ empezar la fase de marcado no sean barridas por tener ese bit activo::
             pages = assign_pages(pool, number_of_pages)
       pages[0].block.free = true                         // Agregado
       pages[0].block_size = PAGE
-      foreach page in pages[1..end]
+      foreach page in pages[1 .. end]
          page.block_size = CONTINUATION
       return pages[0]
 
@@ -1664,8 +1665,8 @@ empezar la fase de marcado no sean barridas por tener ese bit activo::
             block.mark = true       //
       return pool
 
-Finalmente, el punto nÃºmero tres puede ser solucionado con el siguiente
-pequeÃ±o cambio::
+Finalmente, el punto nÃºmero 3 puede ser solucionado con el siguiente pequeÃ±o
+cambio::
 
    funciones new_pool(number_of_pages = 1) is
       pool = alloc(pool.sizeof)
@@ -1694,7 +1695,7 @@ recolectada por la fase de barrido cuando termine el marcado).
 
 Estas modificaciones son las que hacen que el algoritmo siga siendo correcto,
 asegurando que no se van a liberar celdas *vivas* (a expensas de diferir la
-liberaciÃ³n de algunas celdas *muertas* por algÃºn tiempo).
+liberaciÃ³n de algunas celdas *muertas* por un tiempo).
 
 
 .. _sol_early_collect:
@@ -1708,9 +1709,9 @@ recolecciÃ³n es controlado por la opciÃ³n ``min_free`` (ver :ref:`sol_ocup`).
 
 De esta forma tambiÃ©n puede correr de forma realmente concurrente el *mutator*
 y el recolector, al menos hasta que se acabe la memoria, en cuyo caso, a menos
-que la opciÃ³n ``eager_alloc`` (ver :ref:`sol_eager_alloc`) tambiÃ©n estÃ©
-activada, se deberÃ¡ esperar a que la fase de marcado termine para recuperar
-memoria en la fase de barrido.
+que la opciÃ³n ``eager_alloc`` tambiÃ©n estÃ© activada (ver
+:ref:`sol_eager_alloc`), se deberÃ¡ esperar a que la fase de marcado termine
+para recuperar memoria en la fase de barrido.
 
 Para facilitar la comprensiÃ³n de esta mejora se muestran sÃ³lo los cambios
 necesarios si no se utiliza la opciÃ³n ``eager_alloc``::
@@ -1839,7 +1840,7 @@ opciones del compilador DMD_:
 ``-release``
    No genera el cÃ³digo para verificar pre y post-condiciones, invariantes de
    representaciÃ³n, operaciones fuera de los lÃ­mites de un arreglo y
-   *assert*\ 's en general (ver :ref:`d_dbc`).
+   *assert*\ s en general (ver :ref:`d_dbc`).
 
 ParÃ¡metros de los programas
 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
@@ -1857,19 +1858,18 @@ que se especifique lo contrario), que se detallan a continuaciÃ³n.
 ``concpu``
    ``40 4 bible.txt``
 
-   Procesa 40 veces un archivo de texto plano (de 4MiB de tamaÃ±o) [#solbible]_
-   utilizando 4 hilos (mÃ¡s el principal).
+   Procesa 40 veces un archivo de texto plano (de 4MiB de tamaÃ±o) utilizando
+   4 hilos (mÃ¡s el principal).
 
 ``split``
    ``bible.txt 2``
 
-   Procesa dos veces un archivo de texto plano (de 4MiB de tamaÃ±o)
-   [#solbible]_.
+   Procesa dos veces un archivo de texto plano (de 4MiB de tamaÃ±o).
 
 ``sbtree``
    ``16``
 
-   Construyen Ã¡rboles con profundidad mÃ¡xima 16.
+   Construye Ã¡rboles con profundidad mÃ¡xima 16.
 
 ``bh``
    ``-b 4000``
@@ -1879,7 +1879,7 @@ que se especifique lo contrario), que se detallan a continuaciÃ³n.
 ``bisort``
    ``-s 2097151``
 
-   Ordena alrededor de 2 millones de nÃºmeros (exactamente :math:`2^21
+   Ordena alrededor de 2 millones de nÃºmeros (exactamente :math:`2^{21}
    = 2097151`).
 
 ``em3d``
@@ -1906,8 +1906,6 @@ que se especifique lo contrario), que se detallan a continuaciÃ³n.
    ``$dst_dir`` es el directorio donde almacenar los archivos generados
    y ``$tango_files`` es la lista de archivos fuente de Tango_.
 
-.. highlight:: d
-
 El resto de los programas se ejecutan sin parÃ¡metros (ver :ref:`sol_bench`
 para una descripciÃ³n detallada sobre cada uno).
 
@@ -1963,8 +1961,6 @@ todo
 
       conservative=0:fork=1:early_collect=1:eager_alloc=1
 
-.. highlight:: d
-
 MÃ©tricas utilizadas
 ^^^^^^^^^^^^^^^^^^^
 Para analizar los resultados se utilizan varias mÃ©tricas. Las mÃ¡s importantes
@@ -2038,7 +2034,7 @@ que ya habÃ­a una en curso.
 AdemÃ¡s, ciertas pruebas se corren variando la cantidad de procesadores
 utilizados, para medir el impacto de la concurrencia en ambientes con un
 procesador solo y con mÃºltiples procesadores. Para esto se utiliza el comando
-:manpage:`taskset`, que establece la *afinidad* de un proceso, *atÃ¡ndolo*
+:manpage:`taskset(1)`, que establece la *afinidad* de un proceso, *atÃ¡ndolo*
 a correr en un cierto conjunto de procesadores. Si bien las pruebas se
 realizan utilizando 1, 2, 3 y 4 procesadores, los resultados presentados en
 general se limitan a 1 y 4 procesadores, ya que no se observan diferencias
@@ -2052,37 +2048,10 @@ En los casos donde se utilizan otro tipo de mÃ©tricas para evaluar aspectos
 particulares sobre alguna modificaciÃ³n se describe como se realiza la mediciÃ³n
 donde se utiliza la mÃ©trica especial.
 
-Variabilidad de los resultados entre ejecuciones
-^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-Es de esperarse que haya una cierta variaciÃ³n en los resultados entre
-corridas, dada la indeterminaciÃ³n inherente a los sistemas operativos de
-tiempo compartido, que compiten por los recursos de la computadora.
+.. flt:: t:sol-setarch
+   :type: table
 
-Para minimizar esta variaciÃ³n se utilizan varias herramientas. En primer
-lugar, se corren las pruebas estableciendo mÃ¡xima prioridad (-19 en Linux_) al
-proceso utilizando el comando :manpage:`nice(1)`. La variaciÃ³n en la
-frecuencia del reloj los procesadores (para ahorrar energÃ­a) puede ser otra
-fuente de variaciÃ³n, por lo que se usa el comando :manpage:`cpufreq-set(1)`
-para establecer la mÃ¡xima frecuencia disponible de manera fija.
-
-Sin embargo, a pesar de tomar estas precauciones, se sigue observando una
-amplia variabilidad entre corridas. AdemÃ¡s se observa una variaciÃ³n mÃ¡s
-importante de la esperada no solo en el tiempo, tambiÃ©n en el consumo de
-memoria, lo que es mÃ¡s extraÃ±o. Esta variaciÃ³n se debe principalmente a que
-Linux_ asigna el espacio de direcciones a los procesos con una componente
-azarosa (por razones de seguridad). AdemÃ¡s, por omisiÃ³n, la llamada al sistema
-:manpage:`mmap(2)` asigna direcciones de memoria altas primero, entregando
-direcciones mÃ¡s bajas en llamadas subsiguientes [LWN90311]_.
-
-El comando :manpage:`setarch(8)` sirve para controlar Ã©ste y otros aspectos de
-Linux_. La opciÃ³n ``-L`` hace que se utilice un esquema de asignaciÃ³n de
-direcciones antiguo, que no tiene una componente aleatoria y asigna primero
-direcciones bajas. La opciÃ³n ``-R`` solamente desactiva la componente azarosa
-al momento de asignar direcciones.
-
-.. ftable:: t:sol-setarch
-
-   VariaciÃ³n entre corridas para TBGC.
+   VariaciÃ³n entre corridas para TBGC
 
    VariaciÃ³n entre corridas para TBGC. La mediciÃ³n estÃ¡ efectuada utilizando
    los valores mÃ¡ximo, mÃ­nimo y media estadÃ­stica de 20 corridas, utilizando
@@ -2090,7 +2059,7 @@ al momento de asignar direcciones.
    realizarse utilizando el desvÃ­o estÃ¡ndar en vez de la amplitud mÃ¡xima, pero
    en este cuadro se quiere ilustrar la variaciÃ³n mÃ¡xima, no la tÃ­pica.
 
-   .. subtable::
+   .. subflt::
 
       Del tiempo total de ejecuciÃ³n.
 
@@ -2112,7 +2081,7 @@ al momento de asignar direcciones.
       voronoi  0.886    0.003    0.006
       ======== ======== ======== ========
 
-   .. subtable::
+   .. subflt::
 
       Del consumo mÃ¡ximo de memoria.
 
@@ -2134,136 +2103,164 @@ al momento de asignar direcciones.
       voronoi  0.001    0.000    0.000
       ======== ======== ======== ========
 
-Ambas opciones, reducen notablemente la variaciÃ³n en los resultados (ver
-cuadro :vref:`t:sol-setarch`). Esto probablemente se debe a la naturaleza
-conservativa del recolector, dado que la probabilidad de tener *falsos
-punteros* depende directamente de los valores de las direcciones de memoria,
-aunque las pruebas en la que hay concurrencia involucrada, se siguen viendo
-grandes variaciones, que probablemente estÃ©n vinculadas a problemas de
-sincronizaciÃ³n que se ven expuestos gracias al indeterminismo inherente a los
-programas multi-hilo.
+.. flt:: fig:sol-bigarr-1cpu
 
-Si bien se obtienen resultados mÃ¡s estables utilizando un esquema diferente al
-utilizado por omisiÃ³n, se decide no hacerlo dado que las mediciones serÃ­an
-menos realistas. Los usuarios en general no usan esta opciÃ³n y se presentarÃ­a
-una visiÃ³n mÃ¡s acotada sobre el comportamiento de los programas. Sin embargo,
-para evaluar el este efecto en los resultados, siempre que sea posible se
-analizan los resultados de un gran nÃºmero de corridas observando
-principalmente su mÃ­nima, media, mÃ¡xima y desvÃ­o estÃ¡ndar.
-
-
-
-Resultados para pruebas sintizadas
-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-
-A continuaciÃ³n se presentan los resultados obtenidos para las pruebas
-sintetizadas (ver :ref:`sol_bench_synth`). Se recuerda que este conjunto de
-resultados es Ãºtil para analizar ciertos aspectos puntuales de las
-modificaciones propuestas, pero en general distan mucho de como se comporta un
-programa real, por lo que los resultados deben ser analizados teniendo esto
-presente.
-
-``bigarr``
-^^^^^^^^^^
-.. fig:: fig:sol-bigarr-1cpu
-
-   Resultados para ``bigarr`` (utilizando 1 procesador).
+   Resultados para ``bigarr`` (utilizando 1 procesador)
 
    Resultados para ``bigarr`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-bigarr-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-bigarr-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-bigarr-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-bigarr-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-bigarr-1cpu.pdf
 
-.. fig:: fig:sol-bigarr-4cpu
+Variabilidad de los resultados entre ejecuciones
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Es de esperarse que haya una cierta variaciÃ³n en los resultados entre
+corridas, dada la indeterminaciÃ³n inherente a los sistemas operativos de
+tiempo compartido, que compiten por los recursos de la computadora.
+
+Para minimizar esta variaciÃ³n se utilizan varias herramientas. En primer
+lugar, se corren las pruebas estableciendo mÃ¡xima prioridad (-19 en Linux_) al
+proceso utilizando el comando :manpage:`nice(1)`. La variaciÃ³n en la
+frecuencia del reloj los procesadores (para ahorrar energÃ­a) puede ser otra
+fuente de variaciÃ³n, por lo que se usa el comando :manpage:`cpufreq-set(1)`
+para establecer la mÃ¡xima frecuencia disponible de manera fija.
+
+Sin embargo, a pesar de tomar estas precauciones, se sigue observando una
+amplia variabilidad entre corridas. AdemÃ¡s se observa una variaciÃ³n mÃ¡s
+importante de la esperada no solo en el tiempo, tambiÃ©n en el consumo de
+memoria, lo que es mÃ¡s extraÃ±o. Esta variaciÃ³n se debe principalmente a que
+Linux_ asigna el espacio de direcciones a los procesos con una componente
+azarosa (por razones de seguridad). AdemÃ¡s, por omisiÃ³n, la llamada al sistema
+:manpage:`mmap(2)` asigna direcciones de memoria altas primero, entregando
+direcciones mÃ¡s bajas en llamadas subsiguientes [LWN90311]_.
 
-   Resultados para ``bigarr`` (utilizando 4 procesadores).
+El comando :manpage:`setarch(8)` sirve para controlar Ã©ste y otros aspectos de
+Linux_. La opciÃ³n ``-L`` hace que se utilice un esquema de asignaciÃ³n de
+direcciones antiguo, que no tiene una componente aleatoria y asigna primero
+direcciones bajas. La opciÃ³n ``-R`` solamente desactiva la componente azarosa
+al momento de asignar direcciones.
+
+Ambas opciones, reducen notablemente la variaciÃ³n en los resultados (ver
+cuadro :vref:`t:sol-setarch`). Esto probablemente se debe a la naturaleza
+conservativa del recolector, dado que la probabilidad de tener *falsos
+positivos* depende directamente de los valores de las direcciones de memoria,
+aunque las pruebas en la que hay concurrencia involucrada, se siguen viendo
+grandes variaciones, que probablemente estÃ©n vinculadas a problemas de
+sincronizaciÃ³n que se ven expuestos gracias al indeterminismo inherente a los
+programas multi-hilo.
+
+Si bien se obtienen resultados mÃ¡s estables utilizando un esquema diferente al
+utilizado por omisiÃ³n, se decide no hacerlo dado que las mediciones serÃ­an
+menos realistas. Los usuarios en general no usan esta opciÃ³n y se presentarÃ­a
+una visiÃ³n mÃ¡s acotada sobre el comportamiento de los programas. Sin embargo,
+para evaluar el este efecto en los resultados, siempre que sea posible se
+analizan los resultados de un gran nÃºmero de corridas observando
+principalmente su mÃ­nima, media, mÃ¡xima y desvÃ­o estÃ¡ndar.
+
+
+
+Resultados para pruebas sintizadas
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+A continuaciÃ³n se presentan los resultados obtenidos para las pruebas
+sintetizadas (ver :ref:`sol_bench_synth`). Se recuerda que este conjunto de
+resultados es Ãºtil para analizar ciertos aspectos puntuales de las
+modificaciones propuestas, pero en general distan mucho de como se comporta un
+programa real, por lo que los resultados deben ser analizados teniendo esto
+presente.
+
+``bigarr``
+^^^^^^^^^^
+En la figura :vref:`fig:sol-bigarr-1cpu` se pueden observar los resultados
+para ``bigarr`` al utilizar un solo procesador. En ella se puede notar que el
+tiempo total de ejecuciÃ³n en general aumenta al utilizar CDGC, esto es
+esperable, dado esta prueba se limitan a usar servicios del recolector. Dado
+que esta ejecuciÃ³n utiliza solo un procesador y por lo tanto no se puede sacar
+provecho a la concurrencia, es de esperarse que el trabajo extra realizado por
+las modificaciones se vea reflejado en los resultados. En la
+:vref:`fig:sol-bigarr-4cpu` (resultados al utilizar 4 procesadores) se puede
+observar como al usar solamente *eager allocation* se recupera un poco el
+tiempo de ejecuciÃ³n, probablemente debido al incremento en la concurrencia
+(aunque no se observa el mismo efecto al usar *early collection*).
+
+Observando el tiempo total de ejecuciÃ³n, no se esperaba un incremento tan
+notorio al pasar de TBGC a una configuraciÃ³n equivalente de CDGC **cons**,
+haciendo un breve anÃ¡lisis de las posibles causas, lo mÃ¡s probable parece ser
+el incremento en la complejidad de la fase de marcado dada capacidad para
+marcar de forma precisa (aunque no se use la opciÃ³n, se paga el precio de la
+complejidad extra y sin obtener los beneficios).  AdemÃ¡s se puede observar
+como el agregado de precisiÃ³n al marcado mejora un poco las cosas (donde sÃ­ se
+obtiene rÃ©dito de la complejidad extra en el marcado).
+
+.. flt:: fig:sol-bigarr-4cpu
+
+   Resultados para ``bigarr`` (utilizando 4 procesadores)
 
    Resultados para ``bigarr`` (utilizando 4 procesadores). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-bigarr-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-bigarr-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-bigarr-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-bigarr-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-bigarr-4cpu.pdf
 
-En la figura :vref:`fig:sol-bigarr-1cpu` se pueden observar los resultados
-para ``bigarr`` al utilizar un solo procesador. En ella se puede notar que el
-tiempo total de ejecuciÃ³n en general aumenta al utilizar CDGC, esto es
-esperable, dado esta prueba se limitan a usar servicios del recolector. Dado
-que esta ejecuciÃ³n utiliza solo un procesador y por lo tanto no se puede sacar
-provecho a la concurrencia, es de esperarse que el trabajo extra realizado por
-las modificaciones se vea reflejado en los resultados. En la
-:vref:`fig:sol-bigarr-4cpu` (resultados al utilizar 4 procesadores) se puede
-observar como al usar solamente *eager allocation* se recupera un poco el
-tiempo de ejecuciÃ³n, probablemente debido al incremento en la concurrencia
-(aunque no se observa el mismo efecto al usar *early collection*).
-
-Observando el tiempo total de ejecuciÃ³n, no se esperaba un incremento tan
-notorio al pasar de TBGC a una configuraciÃ³n equivalente de CDGC **cons**,
-haciendo un breve anÃ¡lisis de las posibles causas, lo mÃ¡s probable parece ser
-el incremento en la complejidad de la fase de marcado dada capacidad para
-marcar de forma precisa (aunque no se use la opciÃ³n, se paga el precio de la
-complejidad extra y sin obtener los beneficios).  AdemÃ¡s se puede observar
-como el agregado de precisiÃ³n al marcado mejora un poco las cosas (donde sÃ­ se
-obtiene rÃ©dito de la complejidad extra en el marcado).
-
 En general se observa que al usar *eager allocation* el consumo de memoria
 y los tiempos de pausa se disparan mientras que la cantidad de recolecciones
 disminuye drÃ¡sticamente. Lo que se observa es que el programa es
@@ -2282,90 +2279,95 @@ incremento en el consumo de memoria, ya que el sistema operativo tiene que
 copiar tablas de memoria mÃ¡s grandes al efectuar el *fork* (ver
 :ref:`sol_fork`).
 
-``concpu``
-^^^^^^^^^^
-.. fig:: fig:sol-concpu-1cpu
+.. raw:: latex
+
+   \clearpage
+
+.. flt:: fig:sol-concpu-1cpu
 
-   Resultados para ``concpu`` (utilizando 1 procesador).
+   Resultados para ``concpu`` (utilizando 1 procesador)
 
    Resultados para ``concpu`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-concpu-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-concpu-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-concpu-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-concpu-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-concpu-1cpu.pdf
 
-.. fig:: fig:sol-concpu-4cpu
+.. flt:: fig:sol-concpu-4cpu
 
-   Resultados para ``concpu`` (utilizando 4 procesadores).
+   Resultados para ``concpu`` (utilizando 4 procesadores)
 
    Resultados para ``concpu`` (utilizando 4 procesadores). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-concpu-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-concpu-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-concpu-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-concpu-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-concpu-4cpu.pdf
 
+``concpu``
+^^^^^^^^^^
 En la figura :vref:`fig:sol-concpu-1cpu` se pueden observar los resultados
 para ``concpu`` al utilizar un solo procesador. En ella se aprecia que el
 tiempo total de ejecuciÃ³n disminuye levemente al usar marcado concurrente
-mientras no se utilice *eager allocation* pero aumenta al utilizarlo.
+mientras no se utilice *eager allocation* (si se utiliza vuelve a aumentar,
+incluso mÃ¡s que sin marcado concurrente).
 
 Con respecto a la cantidad de recolecciones, uso mÃ¡ximo de memoria y tiempo de
 *stop-the-world* se ve un efecto similar al descripto para ``bigarr`` (aunque
@@ -2406,143 +2408,143 @@ Sin embargo, no se encuentra una razÃ³n clara para explicar el crecimiento
 dramÃ¡tico en la cantidad de recolecciones solo al no usar marcado concurrente
 para 4 procesadores.
 
-``conalloc``
-^^^^^^^^^^^^
-.. fig:: fig:sol-conalloc-1cpu
+.. flt:: fig:sol-conalloc-1cpu
 
-   Resultados para ``conalloc`` (utilizando 1 procesador).
+   Resultados para ``conalloc`` (utilizando 1 procesador)
 
    Resultados para ``conalloc`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-conalloc-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-conalloc-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-conalloc-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-conalloc-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-conalloc-1cpu.pdf
 
-.. fig:: fig:sol-conalloc-4cpu
+.. flt:: fig:sol-conalloc-4cpu
 
-   Resultados para ``conalloc`` (utilizando 4 procesadores).
+   Resultados para ``conalloc`` (utilizando 4 procesadores)
 
    Resultados para ``conalloc`` (utilizando 4 procesadores). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-conalloc-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-conalloc-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-conalloc-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-conalloc-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-conalloc-4cpu.pdf
 
-En la figura :vref:`fig:sol-conalloc-1cpu` se pueden observar los resultados
-para ``conalloc`` al utilizar un solo procesador. Los cambios con respecto
-a lo observado para ``concpu`` son mÃ­nimos. El efecto de la mejorÃ­a al usar
-marcado concurrente pero no *eager allocation* no se observa mÃ¡s, dado que
-``conalloc`` pide memoria en todos los hilos, se crea un cuello de botella. Se
-ve claramente como tampoco baja la cantidad de recolecciones hecha debido
-a esto y se invierte la variabilidad entre los tiempos pico de pausa real
-y *stop-the-world* (sin una razÃ³n obvia, pero probablemente relacionado que
-todos los hilos piden memoria).
-
-Al utilizar 4 procesadores (figura :vref:`fig:sol-conalloc-4cpu`), mÃ¡s allÃ¡ de
-las diferencias mencionadas para 1 procesador, no se observan grandes cambios
-con respecto a lo observado para ``concpu``, excepto que los tiempos de pausa
-(real y *stop-the-world*) son notablemente mÃ¡s pequeÃ±os, lo que pareciera
-confirmar un error en la mediciÃ³n de ``concpu``.
-
-``split``
-^^^^^^^^^
-.. fig:: fig:sol-split-1cpu
+.. flt:: fig:sol-split-1cpu
 
-   Resultados para ``split`` (utilizando 1 procesador).
+   Resultados para ``split`` (utilizando 1 procesador)
 
    Resultados para ``split`` (utilizando 1 procesador). Se presenta el mÃ­nimos
    (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris), y el
    mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de ejecuciÃ³n)
    o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-split-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-split-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-split-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-split-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-split-1cpu.pdf
 
+``conalloc``
+^^^^^^^^^^^^
+En la figura :vref:`fig:sol-conalloc-1cpu` se pueden observar los resultados
+para ``conalloc`` al utilizar un solo procesador. Los cambios con respecto
+a lo observado para ``concpu`` son mÃ­nimos. El efecto de la mejorÃ­a al usar
+marcado concurrente pero no *eager allocation* no se observa mÃ¡s, dado que
+``conalloc`` pide memoria en todos los hilos, se crea un cuello de botella. Se
+ve claramente como tampoco baja la cantidad de recolecciones hecha debido
+a esto y se invierte la variabilidad entre los tiempos pico de pausa real
+y *stop-the-world* (sin una razÃ³n obvia, pero probablemente relacionado que
+todos los hilos piden memoria).
+
+Al utilizar 4 procesadores (figura :vref:`fig:sol-conalloc-4cpu`), mÃ¡s allÃ¡ de
+las diferencias mencionadas para 1 procesador, no se observan grandes cambios
+con respecto a lo observado para ``concpu``, excepto que los tiempos de pausa
+(real y *stop-the-world*) son notablemente mÃ¡s pequeÃ±os, lo que pareciera
+confirmar un error en la mediciÃ³n de ``concpu``.
+
+``split``
+^^^^^^^^^
 Este es el primer caso donde se aprecia la sustancial mejora proporcionada por
 una pequeÃ±a optimizaciÃ³n, el cachÃ© de ``findSize()`` (ver
 :ref:`sol_minor_findsize`). En la figura :vref:`fig:sol-split-1cpu` se puede
@@ -2561,145 +2563,149 @@ incluso al usar *eager allocation*.
 Se omiten los resultados para mÃ¡s de un procesador por ser prÃ¡cticamente
 idÃ©nticos para este anÃ¡lisis.
 
-``mcore``
-^^^^^^^^^
-.. fig:: fig:sol-mcore-1cpu
+.. raw:: latex
+
+   \clearpage
+
+.. flt:: fig:sol-mcore-1cpu
 
-   Resultados para ``mcore`` (utilizando 1 procesador).
+   Resultados para ``mcore`` (utilizando 1 procesador)
 
    Resultados para ``mcore`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-mcore-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-mcore-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-mcore-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-mcore-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-mcore-1cpu.pdf
 
-.. fig:: fig:sol-mcore-4cpu
+.. flt:: fig:sol-mcore-4cpu
 
-   Resultados para ``mcore`` (utilizando 4 procesadores).
+   Resultados para ``mcore`` (utilizando 4 procesadores)
 
    Resultados para ``mcore`` (utilizando 4 procesadores). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-mcore-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-mcore-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-mcore-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-mcore-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-mcore-4cpu.pdf
 
-El caso de ``mcore`` es interesante por ser, funcionalmente, una combinaciÃ³n
-entre ``concpu`` y ``split``, con un agregado extra: el incremento notable de
-la competencia por utilizar el recolector entre los mÃºltiples hilos.
+.. flt:: fig:sol-rnddata-1cpu
 
-Los efectos observados (en la figura :vref:`fig:sol-mcore-1cpu` para
-1 procesador y en la figura :vref:`fig:sol-mcore-4cpu` para 4) confirman esto,
-al ser una suma de los efectos observados para ``concpu`` y ``split``, con el
-agregado de una particularidad extra por la mencionada competencia entre
-hilos. A diferencia de ``concpu`` donde el incremento de procesadores resulta
-en un decremento en el tiempo total de ejecuciÃ³n, en este caso resulta en una
-disminuciÃ³n, dado que se necesita mucha sincronizaciÃ³n entre hilos, por
-utilizar todos de forma intensiva los servicios del recolector (y por lo tanto
-competir por su *lock* global).
-
-Otro efecto comÃºn observado es que cuando el tiempo de pausa es muy pequeÃ±o
-(del orden de los milisegundos), el marcado concurrente suele incrementarlo en
-vez de disminuirlo.
-
-``rnddata``
-^^^^^^^^^^^
-.. fig:: fig:sol-rnddata-1cpu
-
-   Resultados para ``rnddata`` (utilizando 1 procesador).
+   Resultados para ``rnddata`` (utilizando 1 procesador)
 
    Resultados para ``rnddata`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-rnddata-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-rnddata-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-rnddata-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-rnddata-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-rnddata-1cpu.pdf
 
+``mcore``
+^^^^^^^^^
+El caso de ``mcore`` es interesante por ser, funcionalmente, una combinaciÃ³n
+entre ``concpu`` y ``split``, con un agregado extra: el incremento notable de
+la competencia por utilizar el recolector entre los mÃºltiples hilos.
+
+Los efectos observados (en la figura :vref:`fig:sol-mcore-1cpu` para
+1 procesador y en la figura :vref:`fig:sol-mcore-4cpu` para 4) confirman esto,
+al ser una suma de los efectos observados para ``concpu`` y ``split``, con el
+agregado de una particularidad extra por la mencionada competencia entre
+hilos. A diferencia de ``concpu`` donde el incremento de procesadores resulta
+en un decremento en el tiempo total de ejecuciÃ³n, en este caso resulta en un
+incremento, dado que se necesita mucha sincronizaciÃ³n entre hilos, por
+utilizar todos de forma intensiva los servicios del recolector (y por lo tanto
+competir por su *lock* global).
+
+Otro efecto comÃºn observado es que cuando el tiempo de pausa es muy pequeÃ±o
+(del orden de los milisegundos), el marcado concurrente suele incrementarlo en
+vez de disminuirlo.
+
+``rnddata``
+^^^^^^^^^^^
 En la figura :vref:`fig:sol-rnddata-1cpu` se presentan los resultados para
 ``rnddata`` utilizando 1 procesador. Una vez mÃ¡s estamos ante un caso en el
 cual se observa claramente la mejorÃ­a gracias a una modificaciÃ³n en particular
@@ -2722,12 +2728,12 @@ pagar si se necesitan tiempos de pausa muy pequeÃ±os).
 El aumento en el variaciÃ³n de los tiempos de ejecuciÃ³n al usar marcado preciso
 probablemente se debe a lo siguiente: con marcado conservativo, debe estar
 sobreviviendo a las recolecciones el total de memoria pedida por el programa,
-debido a falsos punteros (por eso no se observa prÃ¡cticamente variaciÃ³n en el
+debido a *falsos positivos* (por eso no se observa prÃ¡cticamente variaciÃ³n en el
 tiempo de ejecuciÃ³n y memoria mÃ¡xima consumida); al marcar con precisiÃ³n
-parcial, se logra disminuir mucho la cantidad de falsos punteros, pero el
+parcial, se logra disminuir mucho la cantidad de *falsos positivos*, pero el
 *stack* y la memoria estÃ¡tica, se sigue marcado de forma conservativa, por lo
 tanto dependiendo de los valores (aleatorios) generados por la prueba, aumenta
-o disminuye la cantidad de falsos punteros, variando asÃ­ la cantidad de
+o disminuye la cantidad de *falsos positivos*, variando asÃ­ la cantidad de
 memoria consumida y el tiempo de ejecuciÃ³n.
 
 No se muestran los resultados para mÃ¡s de un procesador por ser demasiado
@@ -2743,79 +2749,67 @@ objetos grandes y otra objetos pequeÃ±os, pero esta diferencia parece no
 afectar la forma en la que se comportan los cambios introducidos en este
 trabajo.
 
+.. flt:: fig:sol-bh-1cpu
 
-Resultados para pruebas pequeÃ±as
-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-
-A continuaciÃ³n se presentan los resultados obtenidos para las pruebas pequeÃ±as
-(ver :ref:`sol_bench_small`). Se recuerda que si bien este conjunto de pruebas
-se compone de programas reales, que efectÃºan una tarea Ãºtil, estÃ¡n diseÃ±ados
-para ejercitar la asignaciÃ³n de memoria y que no son recomendados para evaluar
-el desempeÃ±o de recolectores de basura. Sin embargo se las utiliza igual por
-falta de programas mÃ¡s realistas, por lo que hay que tomarlas como un grado de
-suspicacia.
-
-``bh``
-^^^^^^
-.. fig:: fig:sol-bh-1cpu
-
-   Resultados para ``bh`` (utilizando 1 procesador).
+   Resultados para ``bh`` (utilizando 1 procesador)
 
    Resultados para ``bh`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-bh-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-bh-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-bh-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-bh-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-bh-1cpu.pdf
 
-En la figura :vref:`fig:sol-bh-1cpu` se pueden observar los resultados
-para ``bh`` al utilizar un solo procesador. Ya en una prueba un poco mÃ¡s
-realista se puede observar el efecto positivo del marcado preciso, en especial
-en la cantidad de recolecciones efectuadas (aunque no se traduzca en un menor
-consumo de memoria).
+.. raw:: latex
 
-Sin embargo se observa tambiÃ©n un efecto nocivo del marcado preciso en el
-consumo de memoria que intuitivamente deberÃ­a disminuir, pero crece, y de
-forma considerable (unas 3 veces en promedio). La razÃ³n de esta particularidad
-es el incremento en el espacio necesario para almacenar objetos debido a que
-el puntero a la informaciÃ³n del tipo se guarda al final del bloque (ver
-:ref:`sol_precise`). En el cuadro :vref:`t:sol-prec-mem-bh` se puede observar
-la cantidad de memoria pedida por el programa, la cantidad de memoria
-realmente asignada por el recolector (y la memoria desperdiciada) cuando se
-usa marcado conservativo y preciso. Estos valores fueron tomados usando la
-opciÃ³n ``malloc_stats_file`` (ver :ref:`sol_stats`).
+   \clearpage
+
+
+Resultados para pruebas pequeÃ±as
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+A continuaciÃ³n se presentan los resultados obtenidos para las pruebas pequeÃ±as
+(ver :ref:`sol_bench_small`). Se recuerda que si bien este conjunto de pruebas
+se compone de programas reales, que efectÃºan una tarea Ãºtil, estÃ¡n diseÃ±ados
+para ejercitar la asignaciÃ³n de memoria y que no son recomendados para evaluar
+el desempeÃ±o de recolectores de basura. Sin embargo se las utiliza igual por
+falta de programas mÃ¡s realistas, por lo que hay que tomarlas como un grado de
+suspicacia.
 
-.. ftable:: t:sol-prec-mem-bh
+``bh``
+^^^^^^
+.. flt:: t:sol-prec-mem-bh
+   :type: table
 
-   Memoria pedida y asignada para ``bh`` segÃºn modo de marcado.
+   Memoria pedida y asignada para ``bh`` segÃºn modo de marcado
 
    Memoria pedida y asignada para ``bh`` segÃºn modo de marcado conservativo
    o preciso (acumulativo durante toda la vida del programa).
@@ -2827,55 +2821,72 @@ opciÃ³n ``malloc_stats_file`` (ver :ref:`sol_stats`).
    Preciso        302.54         472.26         169.72 (36%)
    ============== ============== ============== =================
 
-MÃ¡s allÃ¡ de esto, los resultados son muy similares a los obtenidos para
-pruebas sintetizadas que se limitan a ejercitar el recolector (como ``bigarr``
-y ``sbtree``), lo que habla de lo mucho que tambiÃ©n lo hace este pequeÃ±o
-programa.
-
-No se muestran los resultados para mÃ¡s de un procesador por ser extremadamente
-similares a los obtenidos utilizando solo uno.
-
-``bisort``
-^^^^^^^^^^
-.. fig:: fig:sol-bisort-1cpu
+.. flt:: fig:sol-bisort-1cpu
 
-   Resultados para ``bisort`` (utilizando 1 procesador).
+   Resultados para ``bisort`` (utilizando 1 procesador)
 
    Resultados para ``bisort`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-bisort-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-bisort-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-bisort-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-bisort-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-bisort-1cpu.pdf
 
+En la figura :vref:`fig:sol-bh-1cpu` se pueden observar los resultados
+para ``bh`` al utilizar un solo procesador. Ya en una prueba un poco mÃ¡s
+realista se puede observar el efecto positivo del marcado preciso, en especial
+en la cantidad de recolecciones efectuadas (aunque no se traduzca en un menor
+consumo de memoria).
+
+Sin embargo se observa tambiÃ©n un efecto nocivo del marcado preciso en el
+consumo de memoria que intuitivamente deberÃ­a disminuir, pero crece, y de
+forma considerable (unas 3 veces en promedio). La razÃ³n de esta particularidad
+es el incremento en el espacio necesario para almacenar objetos debido a que
+el puntero a la informaciÃ³n del tipo se guarda al final del bloque (ver
+:ref:`sol_precise`). En el cuadro :vref:`t:sol-prec-mem-bh` se puede observar
+la cantidad de memoria pedida por el programa, la cantidad de memoria
+realmente asignada por el recolector (y la memoria desperdiciada) cuando se
+usa marcado conservativo y preciso. Estos valores fueron tomados usando la
+opciÃ³n ``malloc_stats_file`` (ver :ref:`sol_stats`).
+
+MÃ¡s allÃ¡ de esto, los resultados son muy similares a los obtenidos para
+pruebas sintetizadas que se limitan a ejercitar el recolector (como ``bigarr``
+y ``sbtree``), lo que habla de lo mucho que tambiÃ©n lo hace este pequeÃ±o
+programa.
+
+No se muestran los resultados para mÃ¡s de un procesador por ser extremadamente
+similares a los obtenidos utilizando solo uno.
+
+``bisort``
+^^^^^^^^^^
 La figura :vref:`fig:sol-bisort-1cpu` muestra los resultados para ``bisort``
 al utilizar 1 procesador. En este caso el parecido es con los resultados para
 la prueba sintetizada ``split``, con la diferencia que el tiempo de ejecuciÃ³n
@@ -2885,194 +2896,198 @@ cachÃ© de ``findSize()``).
 
 Otra diferencia notable es la considerable reducciÃ³n del tiempo de pausa real
 al utilizar *early collection* (mÃ¡s de 3 veces menor en promedio comparado
-a cuando se marca conservativamente, y mÃ¡s de 2 veces menor que cuando se hace
-de forma precisa), lo que indica que la predicciÃ³n de cuando se va a necesitar
-una recolecciÃ³n es mÃ¡s efectiva que para ``split``.
+a cuando se marca de forma conservativa, y mÃ¡s de 2 veces menor que cuando se
+hace de forma precisa), lo que indica que la predicciÃ³n de cuando se va
+a necesitar una recolecciÃ³n es mÃ¡s efectiva que para ``split``.
 
 No se muestran los resultados para mÃ¡s de un procesador por ser extremadamente
 similares a los obtenidos utilizando solo uno.
 
-``em3d``
-^^^^^^^^
-.. fig:: fig:sol-em3d-1cpu
+.. raw:: latex
+
+   \clearpage
 
-   Resultados para ``em3d`` (utilizando 1 procesador).
+.. flt:: fig:sol-em3d-1cpu
+
+   Resultados para ``em3d`` (utilizando 1 procesador)
 
    Resultados para ``em3d`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-em3d-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-em3d-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-em3d-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-em3d-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-em3d-1cpu.pdf
 
+``em3d``
+^^^^^^^^
 Los resultados para ``em3d`` (figura :vref:`fig:sol-em3d-1cpu`) son
 sorprendentemente similares a los de ``bisort``. La Ãºnica diferencia es que en
-este caso el marcado preciso y el uso de *early collection** no parecen
+este caso el marcado preciso y el uso de *early collection* no parecen
 ayudar; por el contrario, aumentan levemente el tiempo de pausa real.
 
 Una vez mÃ¡s no se muestran los resultados para mÃ¡s de un procesador por ser
 extremadamente similares a los obtenidos utilizando solo uno.
 
-``tsp``
-^^^^^^^^
-.. fig:: fig:sol-tsp-1cpu
+.. flt:: fig:sol-tsp-1cpu
 
-   Resultados para ``tsp`` (utilizando 1 procesador).
+   Resultados para ``tsp`` (utilizando 1 procesador)
 
    Resultados para ``tsp`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-tsp-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-tsp-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-tsp-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-tsp-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-tsp-1cpu.pdf
 
-Los resultados para ``tsp`` (figura :vref:`fig:sol-tsp-1cpu`) son
-prÃ¡cticamente idÃ©nticos a los de ``bisort``. La Ãºnica diferencia es que la
-reducciÃ³n del tiempo de pausa real es un poco menor.
-
-Esto confirma en cierta medida la poca utilidad de este juego de pruebas para
-medir el rendimiento de un recolector, dado que evidentemente, si bien todas
-resuelven problemas diferentes, realizan todas el mismo tipo de trabajo.
+.. flt:: fig:sol-voronoi-1cpu
 
-Una vez mÃ¡s no se muestran los resultados para mÃ¡s de un procesador por ser
-extremadamente similares a los obtenidos utilizando solo uno.
-
-``voronoi``
-^^^^^^^^^^^
-.. fig:: fig:sol-voronoi-1cpu
-
-   Resultados para ``voronoi`` (utilizando 1 procesador).
+   Resultados para ``voronoi`` (utilizando 1 procesador)
 
    Resultados para ``voronoi`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-voronoi-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-voronoi-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-voronoi-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-voronoi-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-voronoi-1cpu.pdf
 
-.. fig:: fig:sol-voronoi-4cpu
+.. flt:: fig:sol-voronoi-4cpu
 
-   Resultados para ``voronoi`` (utilizando 4 procesadores).
+   Resultados para ``voronoi`` (utilizando 4 procesadores)
 
    Resultados para ``voronoi`` (utilizando 4 procesadores). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-voronoi-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-voronoi-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-voronoi-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-voronoi-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-voronoi-4cpu.pdf
 
+``tsp``
+^^^^^^^^
+Los resultados para ``tsp`` (figura :vref:`fig:sol-tsp-1cpu`) son
+prÃ¡cticamente idÃ©nticos a los de ``bisort``. La Ãºnica diferencia es que la
+reducciÃ³n del tiempo de pausa real es un poco menor.
+
+Esto confirma en cierta medida la poca utilidad de este juego de pruebas para
+medir el rendimiento de un recolector, dado que evidentemente, si bien todas
+resuelven problemas diferentes, realizan todas el mismo tipo de trabajo.
+
+Una vez mÃ¡s no se muestran los resultados para mÃ¡s de un procesador por ser
+extremadamente similares a los obtenidos utilizando solo uno.
+
+``voronoi``
+^^^^^^^^^^^
 En la figura :vref:`fig:sol-voronoi-1cpu` se presentan los resultados para
 ``voronoi``, probablemente la prueba mÃ¡s interesante de este conjunto de
 pruebas pequeÃ±as.
@@ -3084,10 +3099,10 @@ este caso no parece provenir toda la ganancia solo de ese cambio, dado que
 para TBGC se ve una variaciÃ³n entre los resultados muy grande que desaparece
 al cambiar a CDGC, esto no puede ser explicado por esa optimizaciÃ³n. En
 general la disminuciÃ³n de la variaciÃ³n de los resultados hemos visto que estÃ¡
-asociada al incremento en la precisiÃ³n en el marcado, dado que los falsos
-punteros ponen una cuota de aleatoriedad importante. Pero este tampoco parece
-ser el caso, ya que no se observan cambios apreciables al pasar a usar marcado
-preciso.
+asociada al incremento en la precisiÃ³n en el marcado, dado que los *falsos
+positivos* ponen una cuota de aleatoriedad importante. Pero este tampoco
+parece ser el caso, ya que no se observan cambios apreciables al pasar a usar
+marcado preciso.
 
 Lo que se observa en esta oportunidad es un caso patolÃ³gico de un mal factor
 de ocupaciÃ³n del *heap* (ver :ref:`sol_ocup`). Lo que muy probablemente estÃ¡
@@ -3107,104 +3122,104 @@ al usar 4 (ver figura :vref:`fig:sol-voronoi-4cpu` disminuye levemente (ademÃ¡s
 de otros cambios en el nivel de variaciÃ³n, pero en general las medias no
 cambian).
 
-
 Resultados para pruebas reales
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
-A continuaciÃ³n se presentan los resultados obtenidos para las pruebas reales
-(ver :ref:`sol_bench_real`). Recordamos que solo se pudo halla un programa que
-pueda ser utilizado a este fin, Dil_, y que el objetivo principal de este
-trabajo se centra alrededor de obtener resultados positivos para este
-programa, por lo que a pesar de ser una Ãºnica prueba, se le presta particular
-atenciÃ³n.
-
-``dil``
-^^^^^^^
-.. fig:: fig:sol-dil-1cpu
+.. flt:: fig:sol-dil-1cpu
 
-   Resultados para ``dil`` (utilizando 1 procesador).
+   Resultados para ``dil`` (utilizando 1 procesador)
 
    Resultados para ``dil`` (utilizando 1 procesador). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-dil-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-dil-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-dil-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-dil-1cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-dil-1cpu.pdf
 
-.. fig:: fig:sol-dil-4cpu
+A continuaciÃ³n se presentan los resultados obtenidos para las pruebas reales
+(ver :ref:`sol_bench_real`). Recordamos que solo se pudo halla un programa que
+pueda ser utilizado a este fin, Dil_, y que el objetivo principal de este
+trabajo se centra alrededor de obtener resultados positivos para este
+programa, por lo que a pesar de ser una Ãºnica prueba, se le presta particular
+atenciÃ³n.
+
+``dil``
+^^^^^^^
+En la figura :vref:`fig:sol-dil-1cpu` se presentan los resultados para
+``dil`` al utilizar un procesador. Una vez mÃ¡s vemos una mejorÃ­a inmediata del
+tiempo total de ejecuciÃ³n al pasar de TBGC a CDGC, y una vez mÃ¡s se debe
+principalmente al mal factor de ocupaciÃ³n del *heap* de TBGC, dado que
+utilizando CDGC con la opciÃ³n ``min_free=0`` se obtiene una media del orden de
+los 80 segundos, bastante mÃ¡s alta que el tiempo obtenido para TBGC.
 
-   Resultados para ``dil`` (utilizando 4 procesadores).
+.. flt:: fig:sol-dil-4cpu
+   :placement: t
+
+   Resultados para ``dil`` (utilizando 4 procesadores)
 
    Resultados para ``dil`` (utilizando 4 procesadores). Se presenta el
    mÃ­nimos (en negro), la media centrada entre dos desvÃ­os estÃ¡ndar (en gris),
    y el mÃ¡ximo (en blanco) calculados sobre 50 corridas (para tiempo de
    ejecuciÃ³n) o 20 corridas (para el resto).
 
-   .. subfig::
+   .. subflt::
 
       Tiempo de ejecuciÃ³n (seg)
 
       .. image:: plots/time-dil-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Cantidad de recolecciones
 
       .. image:: plots/ncol-dil-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Uso mÃ¡ximo de memoria (MiB)
 
       .. image:: plots/mem-dil-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       *Stop-the-world* mÃ¡ximo (seg)
 
       .. image:: plots/stw-dil-4cpu.pdf
 
-   .. subfig::
+   .. subflt::
 
       Pausa real mÃ¡xima (seg)
 
       .. image:: plots/pause-dil-4cpu.pdf
 
-En la figura :vref:`fig:sol-dil-1cpu` se presentan los resultados para
-``dil`` al utilizar un procesador. Una vez mÃ¡s vemos una mejorÃ­a inmediata del
-tiempo total de ejecuciÃ³n al pasar de TBGC a CDGC, y una vez mÃ¡s se debe
-principalmente al mal factor de ocupaciÃ³n del *heap* de TBGC, dado que
-utilizando CDGC con la opciÃ³n ``min_free=0`` se obtiene una media del orden de
-los 80 segundos, bastante mÃ¡s alta que el tiempo obtenido para TBGC.
-
 Sin embargo se observa un pequeÃ±o incremento del tiempo de ejecuciÃ³n al
 introducir marcado preciso, y un incremento bastante mÃ¡s importante (de
 alrededor del 30%) en el consumo mÃ¡ximo de memoria. Nuevamente, como pasa con
@@ -3214,14 +3229,11 @@ informaciÃ³n del tipo se guarda al final del bloque (ver :ref:`sol_precise`).
 En el cuadro :vref:`t:sol-prec-mem-dil` se puede observar la diferencia de
 memoria desperdiciada entre el modo conservativo y preciso.
 
-El pequeÃ±o incremento en el tiempo total de ejecuciÃ³n podrÃ­a estar dado por la
-mayor probabilidad de tener *falsos punteros* debido al incremento del tamaÃ±o
-del *heap*; se recuerda que el *stack* y memoria estÃ¡tica se siguen marcado de
-forma conservativa, incluso en modo preciso.
-
-.. ftable:: t:sol-prec-mem-dil
+.. flt:: t:sol-prec-mem-dil
+   :type: table
+   :placement: b
 
-   Memoria pedida y asignada para ``dil`` segÃºn modo de marcado.
+   Memoria pedida y asignada para ``dil`` segÃºn modo de marcado
 
    Memoria pedida y asignada para ``dil`` segÃºn modo de marcado conservativo
    o preciso (acumulativo durante toda la vida del programa).
@@ -3233,12 +3245,17 @@ forma conservativa, incluso en modo preciso.
    Preciso        307.48         460.24         152.76 (33%)
    ============== ============== ============== =================
 
+El pequeÃ±o incremento en el tiempo total de ejecuciÃ³n podrÃ­a estar dado por la
+mayor probabilidad de tener *falsos positivos* debido al incremento del tamaÃ±o
+del *heap*; se recuerda que el *stack* y memoria estÃ¡tica se siguen marcado de
+forma conservativa, incluso en modo preciso.
+
 TambiÃ©n se puede observar una gran disminuciÃ³n del tiempo total de ejecuciÃ³n
-(cerca de un 60%, y mÃ¡s de un 200% comparado con TBGC) alrededor de la mitad)
-al empezar a usar *eager allocation*, acompaÃ±ado como es usual de una baja en
-la cantidad de recolecciones realizadas (esta vez mayor, de mÃ¡s de 3 veces)
-y de una caÃ­da drÃ¡stica del tiempo de pausa real (alrededor de 40 veces mÃ¡s
-pequeÃ±o); todo esto con un incremento marginal en el consumo total de memoria
+al empezar a usar *eager allocation* (cerca de un 60%, y mÃ¡s de un 200%
+comparado con TBGC), acompaÃ±ado como es usual de una baja en la cantidad de
+recolecciones realizadas (esta vez mayor, de mÃ¡s de 3 veces) y de una caÃ­da
+drÃ¡stica del tiempo de pausa real (alrededor de 40 veces mÃ¡s pequeÃ±o); todo
+esto con un incremento marginal en el consumo total de memoria
 (aproximadamente un 5%). En este caso el uso de *early collection* apenas
 ayuda a bajar el tiempo de pausa real en un 20% en promedio aproximadamente.
 El tiempo de *stop-the-world* cae dramÃ¡ticamente al empezar a realizar la fase
@@ -3265,15 +3282,14 @@ buena recepciÃ³n por parte de la comunidad a las modificaciones propuestas.
 Una vez agregado el marcado concurrente se hace un anuncio en el grupo de
 noticias que tambiÃ©n muestra buenos comentarios y aceptaciÃ³n, en particular
 por parte de Sean Kelly, encargado de mantener el *runtime* de `D 2.0`_, que
-comienza a trabajar en adaptar el recolector con idea de tal vez incluirlo en
-el futuro [NGA19235]_. Poco despuÃ©s Sean Kelly publica una versiÃ³n preliminar
-de la adaptaciÃ³n en la lista de correos que coordina el desarrollo del
-*runtime* de `D 2.0`_ [DRT117]_.
-
-TambiÃ©n se ha mostrado interÃ©s de incluirlo en Tango_, aunque no se han ha
-comenzado aÃºn con la adaptaciÃ³n, pero deberÃ­a ser trivial dado que este
-trabajo se desarrolla usando Tango_ (y el recolector estÃ¡ basado en el de
-Tango_) [TT1997]_.
+comienza a trabajar en adaptar el recolector con idea de tal vez incluirlo de
+manera oficial en el futuro [NGA19235]_. Poco despuÃ©s Sean Kelly publica una
+versiÃ³n preliminar de la adaptaciÃ³n en la lista de correos que coordina el
+desarrollo del *runtime* de `D 2.0`_ [DRT117]_.
+
+TambiÃ©n se ha mostrado interÃ©s de incluirlo en Tango_, por lo que se han
+publicado los cambios necesarios en el sistema de seguimiento de mejoras
+y se encuentran actualmente en etapa de revisiÃ³n [TT1997]_.
 
 
 .. include:: links.rst