X-Git-Url: https://git.llucax.com/z.facultad/75.00/informe.git/blobdiff_plain/f0fa88b43b9fae7a2011ffeb77e1311060d1bc12..cc084c7bb4328177c8a512e79286ba6006460045:/source/dgc.rst

diff --git a/source/dgc.rst b/source/dgc.rst
index 9019246..14d78aa 100644
--- a/source/dgc.rst
+++ b/source/dgc.rst
@@ -461,25 +461,36 @@ algoritmo::
       mark_free_lists()
       mark_static_data()
       push_registers_into_stack()
+      thread_self.stack.end = get_stack_top()
       mark_stacks()
+      pop_registers_from_stack()
       mark_user_roots()
       mark_heap()
       start_the_world()
 
 La variable **global** ``more_to_scan`` indica al algoritmo iterativo cuando
-debe finalizar: la funciÃ³n ``mark()`` (que veremos mÃ¡s adelante) lo pone en
-``true`` cuando una nueva celda debe ser visitada, por lo tanto la iteraciÃ³n
-se interrumpe cuando no hay mÃ¡s celdas por visitar.
+debe finalizar: la funciÃ³n ``mark_range()`` (que veremos mÃ¡s adelante) lo pone
+en ``true`` cuando una nueva celda debe ser visitada, por lo tanto la
+iteraciÃ³n se interrumpe cuando no hay mÃ¡s celdas por visitar.
 
-Las funciones ``stop_the_world()`` y ``start_the_world()`` sencillamente
-pausan y reanudan todos los hilos respectivamente::
+Las funciones ``stop_the_world()`` y ``start_the_world()`` pausan y reanudan
+todos los hilos respectivamente (salvo el actual). Al pausar los hilos ademÃ¡s
+se guardan los registros del procesador en el *stack* y se guarda la posiciÃ³n
+actual del *stack* para que la fase de marcado pueda recorrerlos::
 
    function stop_the_world() is
       foreach thread in threads
+         if thread is thread_self
+            continue
          thread.pause()
+         push_registers_into_stack()
+         thread.stack.end = get_stack_top()
 
    function start_the_world() is
       foreach thread in threads
+         if thread is thread_self
+            continue
+         pop_registers_from_stack()
          thread.resume()
 
 La funciÃ³n ``clear_mark_scan_bits()`` se encarga de restablecer todos los
@@ -517,9 +528,7 @@ Primero se marca el Ã¡rea de memoria estÃ¡tica de manera :ref:`conservativa
 <gc_conserv>` (es decir, tomando cada *word* como si fuera un puntero)::
 
    function mark_static_data() is
-      foreach word in static_data
-         pointer = cast(void*) word
-         mark(pointer)
+      mark_range(static_data.begin, static_data.end)
 
 Para poder tomar los registros como parte del *root set* primero se apilan
 en el *stack* a travÃ©s de la funciÃ³n::
@@ -528,14 +537,19 @@ en el *stack* a travÃ©s de la funciÃ³n::
       foreach register in registers
          push(register)
 
+Y luego se descartan (no es necesario ni correcto restablecer los valores ya
+que podrÃ­an tener nuevos valores) al sacarlos de la pila::
+
+   function pop_registers_from_stack() is
+      foreach register in reverse(registers)
+         pop()
+
 Una vez hecho esto, basta marcar (de forma conservativa) los *stacks* de todos
 los threads para terminar de marcar el *root set*::
 
    function mark_stacks() is
       foreach thread in threads
-         foreach word in thread.stack
-            pointer = cast(void*) word
-            mark(pointer)
+         mark_range(thread.stack.begin, thread.stack.end)
 
 Dado que D_ soporta manejo de memoria manual al mismo tiempo que memoria
 automÃ¡tica, es posible que existan celdas de memoria que no estÃ©n en el *root
@@ -546,20 +560,23 @@ estas nuevas raÃ­ces. Es por esto que para concluir el marcado del *root set*
 completo se procede a marcar las raÃ­ces definidas por el usuario::
 
    function mark_user_roots() is
-      foreach pointer in user_roots
-         mark(pointer)
+      foreach root_range in user_roots
+         mark_range(root_range.begin, root_range.end)
 
 El algoritmo de marcado no es recursivo sino iterativo por lo tanto al marcar
 una celda (o bloque) no se siguen sus *hijas*, solo se activa el bit de *scan*
 (a menos que la celda no contenga punteros, es decir, tenga el bit *noscan*)::
 
-   function mark(pointer) is
-      [pool, page, block] = find_block(pointer)
-      if block is not null and block.mark is false
-         block.mark = true
-         if block.noscan is false
-            block.scan = true
-            global more_to_scan = true
+   function mark_range(begin, end) is
+      pointer = begin
+      while pointer < end
+         [pool, page, block] = find_block(pointer)
+         if block is not null and block.mark is false
+            block.mark = true
+            if block.noscan is false
+               block.scan = true
+               global more_to_scan = true
+         pointer++
 
 Por lo tanto en este punto, tenemos todas las celdas inmediatamente
 alcanzables desde el *root set* marcadas y con el bit *scan* activado si la
@@ -577,15 +594,11 @@ celdas para visitar (con el bit *scan* activo)::
                      if block.scan is true
                         block.scan = false
                         if page.block_size is PAGE // objeto grande
-                           start = cast(byte*) page
+                           begin = cast(byte*) page
                            end = find_big_object_end(pool, page)
-                           foreach word in start..end
-                                 pointer = cast(void*) word
-                                 mark(pointer)
+                           mark_range(begin, end)
                         else // objeto pequeÃ±o
-                           foreach word in block
-                              pointer = cast(void*) word
-                              mark(pointer)
+                           mark_range(block.begin, block.end)
 
 AquÃ­ puede verse, con un poco de esfuerzo, la utilizaciÃ³n de la
 :ref:`abstracciÃ³n tricolor <gc_intro_tricolor>`: todas las celdas alcanzables
@@ -665,9 +678,9 @@ objetos grandes se marcan todas las pÃ¡ginas que utilizaban como ``FREE``::
    function free_big_object(pool, page) is
       pool_end = cast(byte*) pool.pages + (PAGE_SIZE * pool.number_of_pages)
       do
-         page = cast(byte*) page + PAGE_SIZE
          page.block_size = FREE
-      while page.block_size is CONTINUATION and page < pool_end
+         page = cast(byte*) page + PAGE_SIZE
+      while page < pool_end and page.block_size is CONTINUATION
 
 AdemÃ¡s, los bloques que tienen en atributo ``final`` son finalizados llamando
 a la funciÃ³n ``finalize()``. Esta funciÃ³n es un servicio que provee la
@@ -746,16 +759,15 @@ suficientemente grande como para poder almacenar el tamaÃ±o solicitado). Una
 vez mÃ¡s el algoritmo distingue objetos grandes de pequeÃ±os. Los pequeÃ±os se
 asignan de las siguiente manera::
 
-      function new_small(block_size) is
+   function new_small(block_size) is
+      block = find_block_with_size(block_size)
+      if block is null
+         collect()
          block = find_block_with_size(block_size)
          if block is null
-            collect()
+            new_pool()
             block = find_block_with_size(block_size)
-            if block is null
-               new_pool()
-               block = find_block_with_size(block_size)
-               return null
-         return block
+      return block
 
 Se intenta reiteradas veces conseguir un bloque del tamaÃ±o correcto libre,
 realizando diferentes acciones si no se tiene Ã©xito. Primero se intenta hacer
@@ -765,39 +777,41 @@ pidiendo memoria al *low level allocator* (el sistema operativo generalmente).
 
 Para intentar buscar un bloque de memoria libre se realiza lo siguiente::
 
-      function find_block_with_size(block_size) is
+   function find_block_with_size(block_size) is
+      block = free_lists[block_size].pop_first()
+      if block is null
+         assign_page(block_size)
          block = free_lists[block_size].pop_first()
-         if block is null
-            assign_page(block_size)
-            block = free_lists[block_size].pop_first()
-         return block
+      return block
 
 Si no se puede obtener un bloque de la lista de libres correspondiente, se
 busca asignar una pÃ¡gina libre al tamaÃ±o de bloque deseado de forma de
 *alimentar* la lista de libres con dicho tamaÃ±o::
 
-      function assign_page(block_size) is
-         foreach pool in heap
-            foreach page in pool
-               if page.block_size is FREE
-                  page.block_size = block_size
-                  foreach block in page
-                     free_lists[page.block_size].link(block)
+   function assign_page(block_size) is
+      foreach pool in heap
+         foreach page in pool
+            if page.block_size is FREE
+               page.block_size = block_size
+               foreach block in page
+                  free_lists[page.block_size].link(block)
 
 Cuando todo ello falla, el Ãºltimo recurso consiste en pedir memoria al sistema
 operativo, creando un nuevo *pool*::
 
-      funciones new_pool(number_of_pages = 1) is
-         pool = alloc(pool.sizeof)
-         if pool is null
-            return null
-         pool.number_of_pages = number_of_pages
-         pool.pages = alloc(number_of_pages * PAGE_SIZE)
-         if pool.pages is null
-            free(pool)
-            return null
-         heap.add(pool)
-         return pool
+   function new_pool(number_of_pages = 1) is
+      pool = alloc(pool.sizeof)
+      if pool is null
+         return null
+      pool.number_of_pages = number_of_pages
+      pool.pages = alloc(number_of_pages * PAGE_SIZE)
+      if pool.pages is null
+         free(pool)
+         return null
+      heap.add(pool)
+      foreach page in pool
+         page.block_size = FREE
+      return pool
 
 Se recuerda que la funciÃ³n ``alloc()`` es un :ref:`servicio
 <gc_intro_services>` provisto por el *low level allocator* y en la
@@ -813,22 +827,22 @@ Si el tamaÃ±o de bloque necesario para cumplir con la asignaciÃ³n de memoria es
 de una pÃ¡gina, entonces se utiliza otro algoritmo para alocar un objeto
 grande::
 
-      function new_big(size) is
-         number_of_pages = ceil(size / PAGE_SIZE)
+   function new_big(size) is
+      number_of_pages = ceil(size / PAGE_SIZE)
+      pages = find_pages(number_of_pages)
+      if pages is null
+         collect()
          pages = find_pages(number_of_pages)
          if pages is null
-            collect()
-            pages = find_pages(number_of_pages)
-            if pages is null
-               minimize()
-               pool = new_pool(number_of_pages)
-               if pool is null
-                  return null
-               pages = assign_pages(pool, number_of_pages)
-         pages[0].block_size = PAGE
-         foreach page in pages[1..end]
-            page.block_size = CONTINUATION
-         return pages[0]
+            minimize()
+            pool = new_pool(number_of_pages)
+            if pool is null
+               return null
+            pages = assign_pages(pool, number_of_pages)
+      pages[0].block_size = PAGE
+      foreach page in pages[1..end]
+         page.block_size = CONTINUATION
+      return pages[0]
 
 De forma similar a la asignaciÃ³n de objetos pequeÃ±os, se intenta encontrar una
 serie de pÃ¡ginas contiguas, dentro de un mismo *pool*, suficientes para
@@ -854,34 +868,34 @@ completamente libres::
 Volviendo a la funciÃ³n ``new_big()``, para hallar una serie de pÃ¡ginas
 contiguas se utiliza el siguiente algoritmo::
 
-      function find_pages(number_of_pages) is
-         foreach pool in heap
-            pages = assign_pages(pool, number_of_pages)
-            if pages
-               return pages
-         return null
+   function find_pages(number_of_pages) is
+      foreach pool in heap
+         pages = assign_pages(pool, number_of_pages)
+         if pages
+            return pages
+      return null
 
 Como se dijo, las pÃ¡ginas deben estar contenidas en un mismo *pool* (para
 tener la garantÃ­a de que sean contiguas), por lo tanto se busca *pool* por
 *pool* dicha cantidad de pÃ¡ginas libres consecutivas a travÃ©s del siguiente
 algoritmo::
 
-      function assign_pages(pool, number_of_pages) is
-         pages_found = 0
-         first_page = null
-         foreach page in pool
-            if page.block_size is FREE
-               if pages_found is 0
-                  pages_found = 1
-                  first_page = page
-               else
-                  pages_found = pages_found + 1
-               if pages_found is number_of_pages
-                  return [first_page .. page]
+   function assign_pages(pool, number_of_pages) is
+      pages_found = 0
+      first_page = null
+      foreach page in pool
+         if page.block_size is FREE
+            if pages_found is 0
+               pages_found = 1
+               first_page = page
             else
-               pages_found = 0
-               first_page = null
-         return null
+               pages_found = pages_found + 1
+            if pages_found is number_of_pages
+               return [first_page .. page]
+         else
+            pages_found = 0
+            first_page = null
+      return null
 
 Una vez mÃ¡s, cuando todo ello falla (incluso luego de una recolecciÃ³n), se
 intenta alocar un nuevo *pool*, esta vez con una cantidad de pÃ¡ginas
@@ -1284,10 +1298,8 @@ AsignaciÃ³n de memoria
 
 RecolecciÃ³n
    *mark(pbot, ptop)*
-      marca un rango de memoria. Este mÃ©todo es anÃ¡logo al ``mark()``
-      presentado en la secciÃ³n :ref:`dgc_algo_mark` pero marca un rango
-      completo de memoria, lo que permite que sea considerablemente mÃ¡s
-      eficiente.
+      marca un rango de memoria. Este mÃ©todo es anÃ¡logo al ``mark_range()``
+      presentado en la secciÃ³n :ref:`dgc_algo_mark`.
 
    *fullcollectshell()*
       guarda los registros en el *stack* y llama a ``fullcollect()``. El
@@ -1423,6 +1435,72 @@ utiliza conjuntos de bits. Esto trae dos ventajas principales:
   considerablemente la fase de marcado.
 
 
+.. _dgc_debug:
+
+Herramientas para depuraciÃ³n
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+
+El recolector provee algunas opciones para simplificar el diagnÃ³stico
+y depuraciÃ³n de problemas, tanto del mismo recolector como del programa del
+usuario.
+
+Las opciones mÃ¡s importantes son:
+
+
+``MEMSTOMP``
+   Su funciÃ³n es escribir un patrÃ³n determinado de bits en todos los bytes de
+   un bloque de memoria segÃºn se haya:
+
+   * Pedido un bloque menor a una pÃ¡gina (``0xF0``).
+   * Pedido un bloque mayor a una pÃ¡gina (``0xF1``).
+   * Dejado de usar debido a un pedido de achicamiento de un bloque
+     (``0xF2``).
+   * Pedido mÃ¡s pÃ¡ginas debido a un pedido de agrandamiento de un bloque
+     (``0xF0``).
+   * Liberado intencionalmente por el usuario (``0xF2``).
+   * Barrido (``0xF3``).
+
+   Esto permite al diagnosticar un problema saber, por ejemplo, si un
+   determinado Ã¡rea de memoria fue recolectada recientemente, o liberada por
+   el usuario, o reciÃ©n adquirida, etc. con tan solo ver si un patrÃ³n de bits
+   determinado estÃ¡ presente. Por supuesto puede existir *falsos positivos*
+   pero su probabilidad es lo suficientemente baja como para que sea Ãºtil en
+   la prÃ¡ctica.
+
+``SENTINEL``
+   Su funciÃ³n detectar errores producidos por escribir mÃ¡s allÃ¡ (o antes) del
+   Ã¡rea de memoria solicitada y estÃ¡ implementado reservando un poco mÃ¡s de
+   memoria de la que pide el usuario, devolviendo un puntero a un bloque
+   ubicado dentro del bloque real reservado (en vez de al inicio) y finalmente
+   escribiendo un patrÃ³n de bits en los extremos del borde real (ver figura
+   :vref:`fig:sentinel`), de forma de poder verificar en distintas situaciÃ³n
+   (por ejemplo al barrer el bloque) que esas Ã¡reas de mÃ¡s con los patrones de
+   bits estÃ©n intactas. Esto permite detectar de forma temprana errores tanto
+   en el recolector como en el programa del usuario.
+
+   .. fig:: fig:sentinel
+
+      Esquema de un bloque cuando estÃ¡ activada la opciÃ³n ``SENTINEL``.
+
+      .. aafig::
+
+         |              |              |                              |        |
+         +-- Palabra ---+-- Palabra ---+-- TamaÃ±o bloque de usuario --+- Byte -+
+         |              |              |                              |        |
+
+         +--------------+--------------+------------------------------+--------+
+         |  TamaÃ±o del  |     Pre      |                              |  Post  |
+         |  bloque  de  |              |      Bloque de usuario       |        |
+         |    usuario   |  0xF4F4F4F4  |                              |  0xF5  |
+         +--------------+--------------+------------------------------+--------+
+                                       A
+                                       |
+                   Puntero devuleto ---/
+
+Ambas opciones son seleccionables sÃ³lo en tiempo de compilaciÃ³n del
+recolector, por lo que su utilidad real, al menos para el usuario, se ve
+severamente reducida.
+
 
 .. _dgc_bad:
 
@@ -1436,6 +1514,8 @@ participaciÃ³n y observaciÃ³n del grupo de noticias, de donde se obtuvieron los
 principales problemas percibidos por la comunidad que utiliza el lenguaje.
 
 
+.. _dgc_bad_code:
+
 Complejidad del cÃ³digo y documentaciÃ³n
 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
 El anÃ¡lisis del cÃ³digo fue muy complicado debido a la falta de documentaciÃ³n
@@ -1584,8 +1664,8 @@ y en particular para mejorar la implementaciÃ³n de de arreglos asociativos.
 Referencias dÃ©biles
 ^^^^^^^^^^^^^^^^^^^
 El recolector actual no dispone de soporte de *referencias dÃ©biles*
-[#dgcweakref]_, sin embargo hay una demanda [NGD86840]_ [NGD13301]_ [NGL8264]_
-[NGD69761]_ [NGD74624]_ [NGD88065]_
+[#dgcweakref]_, sin embargo hay una demanda apreciable [NGD86840]_ [NGD13301]_
+[NGL8264]_ [NGD69761]_ [NGD74624]_ [NGD88065]_.
 
 .. [#dgcweakref] Una referencia dÃ©bil (o *weak reference* en inglÃ©s) es
    aquella que que no protege al objeto referenciado de ser reciclado por el
@@ -1594,7 +1674,7 @@ El recolector actual no dispone de soporte de *referencias dÃ©biles*
 Para cubrir esta demanda, se han implementado soluciones como biblioteca para
 suplir la inexistencia de una implementaciÃ³n oficial [NGA9103]_.
 
-Sin embargo Ã©stas son en general poco robustas y extremadamente dependientes
+Sin embargo Ã©stas son en general poco robustas, extremadamente dependientes
 de la implementaciÃ³n del recolector y, en general, presentan problemas muy
 sutiles [NGD88065]_. Por esta razÃ³n se ha discutido la posibilidad de incluir
 la implementaciÃ³n de *referencias dÃ©biles* como parte del lenguaje
@@ -1662,6 +1742,37 @@ bits para la fase de marcado, el resto del algoritmo es casi la versiÃ³n mÃ¡s
 bÃ¡sica de marcado y barrido. Hay mucho lugar para mejoras en este sentido.
 
 
+Configurabilidad
+^^^^^^^^^^^^^^^^
+Si bien el recolector actual tiene algunas caracterÃ­sticas configurables,
+todas son seleccionables sÃ³lo en tiempo de compilaciÃ³n del recolector (no del
+programa del usuario), como por ejemplo las opciones descriptas en
+:ref:`dgc_debug`. Por lo tanto, a nivel prÃ¡ctico, es como si no tuviera
+posibilidad alguna de ser configurado por el usuario, ya que no es parte del
+ciclo de desarrollo normal el recompilar el recolector o *runtime* de un
+lenguaje.
+
+Dado que es imposible que un recolector sea Ã³ptimo para todo tipo de
+programas, es muy deseable permitir una configuraciÃ³n de parÃ¡metros del
+recolector que permitan al usuario ajustarlo a las necesidades particulares de
+sus programas.
+
+
+.. _dgc_bad_ocup:
+
+Factor de ocupaciÃ³n del *heap*
+^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Otro problema potencialmente importante del recolector actual es que no se
+tiene ningÃºn cuidado con respecto a que, luego de una recolecciÃ³n, se haya
+recuperado una buena parte del *heap*. Por lo tanto, en casos extremos, el
+recolector tiene que hacer una recolecciÃ³n por cada peticiÃ³n de memoria, lo
+que es extremadamente ineficiente.
+
+Para evitar esto, habrÃ­a que usar algÃºn esquema para evaluar cuando una
+recolecciÃ³n no fue lo suficientemente *exitosa* y en ese caso pedir mÃ¡s
+memoria al sistema operativo.
+
+
 Detalles
 ^^^^^^^^
 Finalmente hay varios detalles en la implementaciÃ³n actual que podrÃ­an