]> git.llucax.com Git - software/dgc/cdgc.git/log
software/dgc/cdgc.git
14 years agoDo a binary search in findPool()
Leandro Lucarella [Mon, 2 Aug 2010 02:22:46 +0000 (23:22 -0300)]
Do a binary search in findPool()

Since findPool() is sorted, a binary search is more appropriate than
a linear search.

14 years agoSkip non-scanneable words in chunks
Leandro Lucarella [Mon, 2 Aug 2010 01:01:50 +0000 (22:01 -0300)]
Skip non-scanneable words in chunks

14 years agoReturn the real size that can be used in getInfo()
Leandro Lucarella [Mon, 2 Aug 2010 00:59:26 +0000 (21:59 -0300)]
Return the real size that can be used in getInfo()

getInfo() was not aware of the sentinel, returning a size larger than the
size usable by the user. There are probably more places where this
happens.

14 years agoRemove duplicated code in getInfo()
Leandro Lucarella [Sun, 1 Aug 2010 18:14:10 +0000 (15:14 -0300)]
Remove duplicated code in getInfo()

getInfo() just groups the information obtained via findBase(), findSize()
and getAttr(), so use those functions instead of duplicating the code.

14 years agoMinimize the use of findPool()
Leandro Lucarella [Sun, 1 Aug 2010 18:09:14 +0000 (15:09 -0300)]
Minimize the use of findPool()

findPool() is one of the most used functions in the GC, usually taking 15%
of the GC time. This patch minimizes it use by converting the functions
findBase() and findSize() to Pool methods, avoiding calling findPool()
twice (in most cases, when calling findBase() or findSize() we already
know the pool).

14 years agoGroup extern (C) declarations
Leandro Lucarella [Sat, 31 Jul 2010 16:44:06 +0000 (13:44 -0300)]
Group extern (C) declarations

14 years agoMove the locking to the C interface
Leandro Lucarella [Sat, 31 Jul 2010 16:37:45 +0000 (13:37 -0300)]
Move the locking to the C interface

14 years agoConvert methods to free functions
Leandro Lucarella [Sat, 31 Jul 2010 02:43:53 +0000 (23:43 -0300)]
Convert methods to free functions

Making the GC an object makes no sense, since you can't instantiate it
more than once, it just make the code unnecessarily extra indented.

The GC struct now only have attributes (several renamed) and they are only
grouped for clarity (and to make easier to calculate the GC memory
overhead). All methods are converted to free functions that uses a global
instance of the GC struct.

14 years agoMerge iface.d in gc.d
Leandro Lucarella [Fri, 30 Jul 2010 00:15:36 +0000 (21:15 -0300)]
Merge iface.d in gc.d

There is no reason to be in different files, really, it just makes things
harder.

14 years agoRename the global lock and remove staticness
Leandro Lucarella [Thu, 29 Jul 2010 23:55:36 +0000 (20:55 -0300)]
Rename the global lock and remove staticness

It doesn't make any sense to make it static, since all the GC struct can't
be instantiated more than once anyway.

14 years agoUnify GC class and Gcx struct
Leandro Lucarella [Thu, 29 Jul 2010 03:59:49 +0000 (00:59 -0300)]
Unify GC class and Gcx struct

For some unknown reason, the GC implementation was divided in 2, a GC
class and a Gcx struct. This patch unify them in a GC struct. Only code is
moved (and stats are adjusted).

14 years agoRemove obsolete unused variables
Leandro Lucarella [Wed, 28 Jul 2010 22:43:55 +0000 (19:43 -0300)]
Remove obsolete unused variables

14 years agoMake heap precise scanning optional
Leandro Lucarella [Wed, 28 Jul 2010 20:41:36 +0000 (17:41 -0300)]
Make heap precise scanning optional

Now D_GC_OPTS accepts a new boolean option: conservative. When true, the
heap is scanned conservatively, even when type information is available.
The option defaults to false.

14 years agoopts: Fix parsing a single boolean option without args
Leandro Lucarella [Wed, 28 Jul 2010 20:39:30 +0000 (17:39 -0300)]
opts: Fix parsing a single boolean option without args

14 years agostats: Refactor code to avoid duplication
Leandro Lucarella [Wed, 28 Jul 2010 19:36:16 +0000 (16:36 -0300)]
stats: Refactor code to avoid duplication

14 years agostats: Add more type information to malloc logging
Leandro Lucarella [Wed, 28 Jul 2010 04:20:45 +0000 (01:20 -0300)]
stats: Add more type information to malloc logging

14 years agostats: Log the pointer to the allocated memory
Leandro Lucarella [Wed, 28 Jul 2010 03:12:10 +0000 (00:12 -0300)]
stats: Log the pointer to the allocated memory

14 years agoMake heap scanning precise
Leandro Lucarella [Wed, 28 Jul 2010 02:40:46 +0000 (23:40 -0300)]
Make heap scanning precise

This patch[1] is based on the patch provided by Vincent Lang (AKA wm4),
which was based on a patch[2] by David Simcha, both published in the bug
3463[3]. The patch needs a patched Tango runtime (which is part of the
patch[1] for the GC) and a patched[4] DMD to work.

The patched DMD passes type information about pointer locations to
allocations, a PointerMap. The PointerMap has a member bits, which is an
array of size_t elements. The first element is the T.sizeof / size_t,
where T is the type being allocated. The next elements are bitmask
indicating words that should be scanned. After that, the next elements
store another bitmask with the information about pointers. A moving
collector could change the value of words marked as pointers, but not
words that should only be scanned (that words are not guaranteed to be
pointers), so a block could only be moved if it's only reachable by
pointers. The pointers information is not used yet by this patch, only the
scan bits are used.

The precise scanning algorithm is extremely simple, and needs a lot of
optimization, this patch was kept simple on purpose. Optimizations will
follow in separated patches.

A pointer to the type information is stored at the end of the allocated
blocks (only if the blocks should be scanned, blocks marked with NO_SCAN
don't need the type information). This wastes some space, and space that
then have to be scanned, which tends to decrease the performance quite
a bit.

[1] http://d.puremagic.com/issues/attachment.cgi?id=696
[2] http://d.puremagic.com/issues/attachment.cgi?id=489
[3] http://d.puremagic.com/issues/show_bug.cgi?id=3463
[4] http://d.puremagic.com/issues/attachment.cgi?id=700

14 years agoImprove variable names for block attributes
Leandro Lucarella [Wed, 21 Jul 2010 16:45:27 +0000 (13:45 -0300)]
Improve variable names for block attributes

14 years agoAdd statistics collection
Leandro Lucarella [Wed, 9 Jun 2010 22:47:05 +0000 (19:47 -0300)]
Add statistics collection

Statistics meassure this metrics.

For each collection:

* Time spent in the malloc that triggered the collection.
* Time spent with the world stopped.
* Time spent doing the collection.
* Memory info before and after the collection: used, free, overhead and
  wasted memory. Used is the memory used by the mutator, free is the
  memory the mutator can request, overhead is the memory used by the
  collector itself and wasted is memory that is not used by either the
  mutator or collector and that can't be requested by the mutator either.

For each malloc() call:

* Time spent.
* Amount of memory requested.
* Attributes of the requested memory.
* A flag to tell if this call triggered a collection.

Statistics collection is controlled via the D_GC_OPTS environment
variable. To collect malloc statistics, use the option
malloc_stats_file, the value is the path to the file where to store the
malloc statistics (the contents will be replaced). To collect garbage
collection statistics, use the option collect_stats_file, the value is
the path to the file where to store the malloc statistics (the contents
will be replaced). The generated files are in CSV format and have
headers that make them self explanatory.

14 years agoMake the GC configurable at runtime via env vars
Leandro Lucarella [Mon, 19 Jul 2010 16:24:30 +0000 (13:24 -0300)]
Make the GC configurable at runtime via env vars

The GC offers a couple of options to debug memory problems, but they are
selectable only at compile-time. Being the GC part of the compiler
runtime, is not very common for the user to recompile the GC when it has
a memory problem, so making this option available always is very
desirable.

This patch allows configuring the GC via environment variables. 4 options
are available: sentinel, mem_stomp, verbose and log file. Only the first
2 are implemented right now.

For example, to check a program using memory stomping and a sentinel, you
can run it like this (using sh):

$ D_GC_OPTS=mem_stop=1:sentinel

As you can see, the value is optional for boolean options.

14 years agoCall memset() only for large enough chunks of data
Leandro Lucarella [Sat, 3 Jul 2010 02:31:57 +0000 (23:31 -0300)]
Call memset() only for large enough chunks of data

Calling memset() for small memory chunks can be expensive compared to
a simple loop.

14 years agoUse a DynArray to store the memory pools
Leandro Lucarella [Wed, 30 Jun 2010 13:58:46 +0000 (10:58 -0300)]
Use a DynArray to store the memory pools

14 years agoUse a few more initial elements by default
Leandro Lucarella [Wed, 30 Jun 2010 13:58:20 +0000 (10:58 -0300)]
Use a few more initial elements by default

Moving from 4 to 16 can improve the performance a little for short lived
programs.

14 years agoUse a custom dynamic array to store roots and ranges
Leandro Lucarella [Wed, 30 Jun 2010 13:57:18 +0000 (10:57 -0300)]
Use a custom dynamic array to store roots and ranges

14 years agoRemove Gcx destructor
Leandro Lucarella [Tue, 29 Jun 2010 00:09:55 +0000 (21:09 -0300)]
Remove Gcx destructor

There is no point on freeing memory as the OS will do it for us.

14 years agoComment why we avoid calling free with null
Leandro Lucarella [Tue, 22 Jun 2010 03:39:50 +0000 (00:39 -0300)]
Comment why we avoid calling free with null

Even when free() can be called with a null pointer, the extra call might
be significant. On hard GC benchmarks making the test for null in the GC
code (i.e. avoiding the free() call) can reduce the GC time by almost ~5%.

14 years agoRemove debug LOGGING code
Leandro Lucarella [Mon, 21 Jun 2010 23:13:51 +0000 (20:13 -0300)]
Remove debug LOGGING code

This code will be superseded by the statistic collection code, and it was
unmantained and very probably broken (for example, the file and line
number was never filled in).

14 years agoAdd VIM modeline to avoid style errors
Leandro Lucarella [Wed, 9 Jun 2010 22:48:51 +0000 (19:48 -0300)]
Add VIM modeline to avoid style errors

14 years agoUse tango bindings to C standard library functions
Leandro Lucarella [Wed, 9 Jun 2010 22:41:47 +0000 (19:41 -0300)]
Use tango bindings to C standard library functions

As we need to use more libraries it became less practical to maintain our
own set of bindings, and since the GC only works with Tango, it makes
sense to just use Tango bindings.

14 years agoRemove PRINTF debug statements
Leandro Lucarella [Sun, 30 May 2010 23:13:06 +0000 (20:13 -0300)]
Remove PRINTF debug statements

14 years agoFix minor coding style issues
Leandro Lucarella [Sun, 30 May 2010 01:45:06 +0000 (22:45 -0300)]
Fix minor coding style issues

14 years agoUse more explicit imports
Leandro Lucarella [Sun, 30 May 2010 01:44:49 +0000 (22:44 -0300)]
Use more explicit imports

14 years agoAdd missing import for DMD
Leandro Lucarella [Sat, 29 May 2010 23:21:30 +0000 (20:21 -0300)]
Add missing import for DMD

14 years agoMove the modules to package rt.gc.cdgc
Leandro Lucarella [Sat, 29 May 2010 23:11:07 +0000 (20:11 -0300)]
Move the modules to package rt.gc.cdgc

Tango 0.99.9 uses this package scheme, so we follow it for easier
integration.

14 years agoMinor formatting fixes
Leandro Lucarella [Sat, 29 May 2010 23:02:24 +0000 (20:02 -0300)]
Minor formatting fixes

14 years agoAdd weak reference support for Tango 0.99.9
Leandro Lucarella [Sat, 29 May 2010 22:54:04 +0000 (19:54 -0300)]
Add weak reference support for Tango 0.99.9

14 years agoRemove the MULTI_THREADED version
Leandro Lucarella [Thu, 21 Jan 2010 02:38:38 +0000 (23:38 -0300)]
Remove the MULTI_THREADED version

This will be an inherently concurrent GC, so having a non-threaded version
of it makes no sense. Even more, I think the non-threaded doesn't even
compile.

14 years agoRemove (un)committed pages distinction
Leandro Lucarella [Sun, 17 Jan 2010 21:29:52 +0000 (18:29 -0300)]
Remove (un)committed pages distinction

This distinction is only made by Windows, and adds an extra complexity
that probably doesn't worth it (specially for other OSs, where this adds
a little overhead too, in both space and time).

Other OSs (like Linux) even do all the committing automatically, under the
hood, see:
http://git.kernel.org/?p=linux/kernel/git/torvalds/linux-2.6.git;a=blob;\
f=Documentation/vm/overcommit-accounting;hb=HEAD

14 years agoMake allocation functions that can fail return bool
Leandro Lucarella [Sun, 17 Jan 2010 00:48:12 +0000 (21:48 -0300)]
Make allocation functions that can fail return bool

There is no point on returning int, since no error code is returned, just
failure or success.

14 years agoFix spacing style
Leandro Lucarella [Sun, 17 Jan 2010 00:14:07 +0000 (21:14 -0300)]
Fix spacing style

14 years agoDeclare public allocation API
Leandro Lucarella [Sun, 17 Jan 2010 00:01:04 +0000 (21:01 -0300)]
Declare public allocation API

Declare the public API and move comments to the declaration, to avoid
duplication and let ddoc document the functions for all versions.

14 years agoRemove valloc() allocation method
Leandro Lucarella [Sat, 16 Jan 2010 23:45:22 +0000 (20:45 -0300)]
Remove valloc() allocation method

Almost any system that support valloc() supports mmap(), and being
a deprecated function, it makes not much sense to maintain it as an
allocation method.

14 years agoMake sure MAP_ANON exists when using mmap()
Leandro Lucarella [Sat, 16 Jan 2010 23:43:54 +0000 (20:43 -0300)]
Make sure MAP_ANON exists when using mmap()

14 years agoRemove commented out code
Leandro Lucarella [Sat, 16 Jan 2010 23:40:15 +0000 (20:40 -0300)]
Remove commented out code

14 years agoRemove Tango dependency
Leandro Lucarella [Sat, 16 Jan 2010 00:29:31 +0000 (21:29 -0300)]
Remove Tango dependency

To avoid Tango dependency, we need to write our own C-API interface. This
is done in the new gc.libc module. In the future, maybe this module will
use Tango or Phobos accordly, but for now we stay free of dependencies (at
the expense of some extra work).

14 years agoRemove debug version THREADINVARIANT
Leandro Lucarella [Sat, 16 Jan 2010 00:34:25 +0000 (21:34 -0300)]
Remove debug version THREADINVARIANT

The code seemed to be broken, since the self thread ID was stored at
initialization and then asserted that the GC always run from that thread,
which seems far from reality (the GC can be invoked by any thread).

The PRINTF version now doesn't print the current thread ID either.

14 years agoRename module names to make more sense
Leandro Lucarella [Thu, 14 Jan 2010 02:29:33 +0000 (23:29 -0300)]
Rename module names to make more sense

14 years agoMake gc a package
Leandro Lucarella [Sun, 3 Jan 2010 18:20:21 +0000 (15:20 -0300)]
Make gc a package

14 years agoAdd a "clean" target to the Makefile
Leandro Lucarella [Thu, 24 Dec 2009 23:22:19 +0000 (20:22 -0300)]
Add a "clean" target to the Makefile

14 years agoPut built stuff in a separated build directory
Leandro Lucarella [Thu, 24 Dec 2009 23:20:57 +0000 (20:20 -0300)]
Put built stuff in a separated build directory

14 years agoAdd a wrapper script to run programs using CDGC
Leandro Lucarella [Thu, 24 Dec 2009 23:16:01 +0000 (20:16 -0300)]
Add a wrapper script to run programs using CDGC

14 years agoRemove redundant "private" from import statements
Leandro Lucarella [Thu, 24 Dec 2009 23:10:28 +0000 (20:10 -0300)]
Remove redundant "private" from import statements

Since a long while ago, imports are "private" by default.

14 years agoConcurrent D Garbage Collector initial commit
Leandro Lucarella [Thu, 24 Dec 2009 22:56:49 +0000 (19:56 -0300)]
Concurrent D Garbage Collector initial commit

The Concurrent D Garbage Collector (CDGC) is based on the "basic" garbage
collector from the Tango runtime. This first commit is a copy of this GC,
as it is in Tango 0.99.8.

The CDGC is designed only for Linux, at least for now.