]> git.llucax.com Git - software/libev.git/blobdiff - ev.c
*** empty log message ***
[software/libev.git] / ev.c
diff --git a/ev.c b/ev.c
index a9864a72eea93d65a19dcaf8f062df4a7bff8960..14213df8f039858fdcd18a9e79d0ff779d127b70 100644 (file)
--- a/ev.c
+++ b/ev.c
  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  */
-#if EV_USE_CONFIG_H
-# include "config.h"
+
+#ifdef __cplusplus
+extern "C" {
+#endif
+
+#ifndef EV_STANDALONE
+# ifdef EV_CONFIG_H
+#  include EV_CONFIG_H
+# else
+#  include "config.h"
+# endif
+
+# if HAVE_CLOCK_GETTIME
+#  ifndef EV_USE_MONOTONIC
+#   define EV_USE_MONOTONIC 1
+#  endif
+#  ifndef EV_USE_REALTIME
+#   define EV_USE_REALTIME  1
+#  endif
+# else
+#  ifndef EV_USE_MONOTONIC
+#   define EV_USE_MONOTONIC 0
+#  endif
+#  ifndef EV_USE_REALTIME
+#   define EV_USE_REALTIME  0
+#  endif
+# endif
+
+# ifndef EV_USE_NANOSLEEP
+#  if HAVE_NANOSLEEP
+#   define EV_USE_NANOSLEEP 1
+#  else
+#   define EV_USE_NANOSLEEP 0
+#  endif
+# endif
+
+# ifndef EV_USE_SELECT
+#  if HAVE_SELECT && HAVE_SYS_SELECT_H
+#   define EV_USE_SELECT 1
+#  else
+#   define EV_USE_SELECT 0
+#  endif
+# endif
+
+# ifndef EV_USE_POLL
+#  if HAVE_POLL && HAVE_POLL_H
+#   define EV_USE_POLL 1
+#  else
+#   define EV_USE_POLL 0
+#  endif
+# endif
+   
+# ifndef EV_USE_EPOLL
+#  if HAVE_EPOLL_CTL && HAVE_SYS_EPOLL_H
+#   define EV_USE_EPOLL 1
+#  else
+#   define EV_USE_EPOLL 0
+#  endif
+# endif
+   
+# ifndef EV_USE_KQUEUE
+#  if HAVE_KQUEUE && HAVE_SYS_EVENT_H && HAVE_SYS_QUEUE_H
+#   define EV_USE_KQUEUE 1
+#  else
+#   define EV_USE_KQUEUE 0
+#  endif
+# endif
+   
+# ifndef EV_USE_PORT
+#  if HAVE_PORT_H && HAVE_PORT_CREATE
+#   define EV_USE_PORT 1
+#  else
+#   define EV_USE_PORT 0
+#  endif
+# endif
+
+# ifndef EV_USE_INOTIFY
+#  if HAVE_INOTIFY_INIT && HAVE_SYS_INOTIFY_H
+#   define EV_USE_INOTIFY 1
+#  else
+#   define EV_USE_INOTIFY 0
+#  endif
+# endif
+
 #endif
 
 #include <math.h>
 #include <stdlib.h>
-#include <unistd.h>
 #include <fcntl.h>
-#include <signal.h>
 #include <stddef.h>
 
 #include <stdio.h>
 #include <assert.h>
 #include <errno.h>
 #include <sys/types.h>
-#include <sys/wait.h>
-#include <sys/time.h>
 #include <time.h>
 
+#include <signal.h>
+
+#ifdef EV_H
+# include EV_H
+#else
+# include "ev.h"
+#endif
+
+#ifndef _WIN32
+# include <sys/time.h>
+# include <sys/wait.h>
+# include <unistd.h>
+#else
+# define WIN32_LEAN_AND_MEAN
+# include <windows.h>
+# ifndef EV_SELECT_IS_WINSOCKET
+#  define EV_SELECT_IS_WINSOCKET 1
+# endif
+#endif
+
 /**/
 
 #ifndef EV_USE_MONOTONIC
-# define EV_USE_MONOTONIC 1
+# define EV_USE_MONOTONIC 0
+#endif
+
+#ifndef EV_USE_REALTIME
+# define EV_USE_REALTIME 0
+#endif
+
+#ifndef EV_USE_NANOSLEEP
+# define EV_USE_NANOSLEEP 0
 #endif
 
 #ifndef EV_USE_SELECT
 #endif
 
 #ifndef EV_USE_POLL
-# define EV_USE_POLL 0 /* poll is usually slower than select, and not as well tested */
+# ifdef _WIN32
+#  define EV_USE_POLL 0
+# else
+#  define EV_USE_POLL 1
+# endif
 #endif
 
 #ifndef EV_USE_EPOLL
 # define EV_USE_EPOLL 0
 #endif
 
-#ifndef EV_USE_REALTIME
-# define EV_USE_REALTIME 1
+#ifndef EV_USE_KQUEUE
+# define EV_USE_KQUEUE 0
+#endif
+
+#ifndef EV_USE_PORT
+# define EV_USE_PORT 0
+#endif
+
+#ifndef EV_USE_INOTIFY
+# define EV_USE_INOTIFY 0
+#endif
+
+#ifndef EV_PID_HASHSIZE
+# if EV_MINIMAL
+#  define EV_PID_HASHSIZE 1
+# else
+#  define EV_PID_HASHSIZE 16
+# endif
+#endif
+
+#ifndef EV_INOTIFY_HASHSIZE
+# if EV_MINIMAL
+#  define EV_INOTIFY_HASHSIZE 1
+# else
+#  define EV_INOTIFY_HASHSIZE 16
+# endif
 #endif
 
 /**/
 # define EV_USE_REALTIME 0
 #endif
 
+#if !EV_STAT_ENABLE
+# undef EV_USE_INOTIFY
+# define EV_USE_INOTIFY 0
+#endif
+
+#if !EV_USE_NANOSLEEP
+# ifndef _WIN32
+#  include <sys/select.h>
+# endif
+#endif
+
+#if EV_USE_INOTIFY
+# include <sys/inotify.h>
+#endif
+
+#if EV_SELECT_IS_WINSOCKET
+# include <winsock.h>
+#endif
+
 /**/
 
-#define MIN_TIMEJUMP  1. /* minimum timejump that gets detected (if monotonic clock available) */
-#define MAX_BLOCKTIME 59.731 /* never wait longer than this time (to detect time jumps) */
-#define PID_HASHSIZE  16 /* size of pid hash table, must be power of two */
-/*#define CLEANUP_INTERVAL 300. /* how often to try to free memory and re-check fds */
+/*
+ * This is used to avoid floating point rounding problems.
+ * It is added to ev_rt_now when scheduling periodics
+ * to ensure progress, time-wise, even when rounding
+ * errors are against us.
+ * This value is good at least till the year 4000.
+ * Better solutions welcome.
+ */
+#define TIME_EPSILON  0.0001220703125 /* 1/8192 */
 
-#include "ev.h"
+#define MIN_TIMEJUMP  1. /* minimum timejump that gets detected (if monotonic clock available) */
+#define MAX_BLOCKTIME 59.743 /* never wait longer than this time (to detect time jumps) */
+/*#define CLEANUP_INTERVAL (MAX_BLOCKTIME * 5.) /* how often to try to free memory and re-check fds, TODO */
 
-#if __GNUC__ >= 3
+#if __GNUC__ >= 4
 # define expect(expr,value)         __builtin_expect ((expr),(value))
-# define inline                     inline
+# define noinline                   __attribute__ ((noinline))
 #else
 # define expect(expr,value)         (expr)
-# define inline                     static
+# define noinline
+# if __STDC_VERSION__ < 199901L
+#  define inline
+# endif
 #endif
 
 #define expect_false(expr) expect ((expr) != 0, 0)
 #define expect_true(expr)  expect ((expr) != 0, 1)
+#define inline_size        static inline
+
+#if EV_MINIMAL
+# define inline_speed      static noinline
+#else
+# define inline_speed      static inline
+#endif
 
 #define NUMPRI    (EV_MAXPRI - EV_MINPRI + 1)
-#define ABSPRI(w) ((w)->priority - EV_MINPRI)
+#define ABSPRI(w) (((W)w)->priority - EV_MINPRI)
+
+#define EMPTY       /* required for microsofts broken pseudo-c compiler */
+#define EMPTY2(a,b) /* used to suppress some warnings */
+
+typedef ev_watcher *W;
+typedef ev_watcher_list *WL;
+typedef ev_watcher_time *WT;
+
+static int have_monotonic; /* did clock_gettime (CLOCK_MONOTONIC) work? */
+
+#ifdef _WIN32
+# include "ev_win32.c"
+#endif
+
+/*****************************************************************************/
+
+static void (*syserr_cb)(const char *msg);
+
+void
+ev_set_syserr_cb (void (*cb)(const char *msg))
+{
+  syserr_cb = cb;
+}
+
+static void noinline
+syserr (const char *msg)
+{
+  if (!msg)
+    msg = "(libev) system error";
+
+  if (syserr_cb)
+    syserr_cb (msg);
+  else
+    {
+      perror (msg);
+      abort ();
+    }
+}
+
+static void *(*alloc)(void *ptr, long size);
 
-typedef struct ev_watcher *W;
-typedef struct ev_watcher_list *WL;
-typedef struct ev_watcher_time *WT;
+void
+ev_set_allocator (void *(*cb)(void *ptr, long size))
+{
+  alloc = cb;
+}
+
+inline_speed void *
+ev_realloc (void *ptr, long size)
+{
+  ptr = alloc ? alloc (ptr, size) : realloc (ptr, size);
+
+  if (!ptr && size)
+    {
+      fprintf (stderr, "libev: cannot allocate %ld bytes, aborting.", size);
+      abort ();
+    }
+
+  return ptr;
+}
+
+#define ev_malloc(size) ev_realloc (0, (size))
+#define ev_free(ptr)    ev_realloc ((ptr), 0)
+
+/*****************************************************************************/
+
+typedef struct
+{
+  WL head;
+  unsigned char events;
+  unsigned char reify;
+#if EV_SELECT_IS_WINSOCKET
+  SOCKET handle;
+#endif
+} ANFD;
+
+typedef struct
+{
+  W w;
+  int events;
+} ANPENDING;
+
+#if EV_USE_INOTIFY
+typedef struct
+{
+  WL head;
+} ANFS;
+#endif
+
+#if EV_MULTIPLICITY
+
+  struct ev_loop
+  {
+    ev_tstamp ev_rt_now;
+    #define ev_rt_now ((loop)->ev_rt_now)
+    #define VAR(name,decl) decl;
+      #include "ev_vars.h"
+    #undef VAR
+  };
+  #include "ev_wrap.h"
 
-static ev_tstamp now_floor, now, diff; /* monotonic clock */
-ev_tstamp ev_now;
-int ev_method;
+  static struct ev_loop default_loop_struct;
+  struct ev_loop *ev_default_loop_ptr;
 
-static int have_monotonic; /* runtime */
+#else
+
+  ev_tstamp ev_rt_now;
+  #define VAR(name,decl) static decl;
+    #include "ev_vars.h"
+  #undef VAR
 
-static ev_tstamp method_fudge; /* stupid epoll-returns-early bug */
-static void (*method_modify)(int fd, int oev, int nev);
-static void (*method_poll)(ev_tstamp timeout);
+  static int ev_default_loop_ptr;
+
+#endif
 
 /*****************************************************************************/
 
@@ -135,7 +405,7 @@ ev_time (void)
 #endif
 }
 
-static ev_tstamp
+ev_tstamp inline_size
 get_clock (void)
 {
 #if EV_USE_MONOTONIC
@@ -150,103 +420,158 @@ get_clock (void)
   return ev_time ();
 }
 
-#define array_roundsize(base,n) ((n) | 4 & ~3)
-
-#define array_needsize(base,cur,cnt,init)              \
-  if (expect_false ((cnt) > cur))                      \
-    {                                                  \
-      int newcnt = cur;                                        \
-      do                                               \
-        {                                              \
-          newcnt = array_roundsize (base, newcnt << 1);        \
-        }                                              \
-      while ((cnt) > newcnt);                          \
-                                                       \
-      base = realloc (base, sizeof (*base) * (newcnt));        \
-      init (base + cur, newcnt - cur);                 \
-      cur = newcnt;                                    \
+#if EV_MULTIPLICITY
+ev_tstamp
+ev_now (EV_P)
+{
+  return ev_rt_now;
+}
+#endif
+
+void
+ev_sleep (ev_tstamp delay)
+{
+  if (delay > 0.)
+    {
+#if EV_USE_NANOSLEEP
+      struct timespec ts;
+
+      ts.tv_sec  = (time_t)delay;
+      ts.tv_nsec = (long)((delay - (ev_tstamp)(ts.tv_sec)) * 1e9);
+
+      nanosleep (&ts, 0);
+#elif defined(_WIN32)
+      Sleep (delay * 1e3);
+#else
+      struct timeval tv;
+
+      tv.tv_sec  = (time_t)delay;
+      tv.tv_usec = (long)((delay - (ev_tstamp)(tv.tv_sec)) * 1e6);
+
+      select (0, 0, 0, 0, &tv);
+#endif
     }
+}
 
 /*****************************************************************************/
 
-typedef struct
+int inline_size
+array_nextsize (int elem, int cur, int cnt)
 {
-  struct ev_io *head;
-  unsigned char events;
-  unsigned char reify;
-} ANFD;
+  int ncur = cur + 1;
 
-static ANFD *anfds;
-static int anfdmax;
+  do
+    ncur <<= 1;
+  while (cnt > ncur);
 
-static void
-anfds_init (ANFD *base, int count)
-{
-  while (count--)
+  /* if size > 4096, round to 4096 - 4 * longs to accomodate malloc overhead */
+  if (elem * ncur > 4096)
     {
-      base->head   = 0;
-      base->events = EV_NONE;
-      base->reify  = 0;
-
-      ++base;
+      ncur *= elem;
+      ncur = (ncur + elem + 4095 + sizeof (void *) * 4) & ~4095;
+      ncur = ncur - sizeof (void *) * 4;
+      ncur /= elem;
     }
+
+  return ncur;
 }
 
-typedef struct
+static noinline void *
+array_realloc (int elem, void *base, int *cur, int cnt)
 {
-  W w;
-  int events;
-} ANPENDING;
+  *cur = array_nextsize (elem, *cur, cnt);
+  return ev_realloc (base, elem * *cur);
+}
 
-static ANPENDING *pendings [NUMPRI];
-static int pendingmax [NUMPRI], pendingcnt [NUMPRI];
+#define array_needsize(type,base,cur,cnt,init)                 \
+  if (expect_false ((cnt) > (cur)))                            \
+    {                                                          \
+      int ocur_ = (cur);                                       \
+      (base) = (type *)array_realloc                           \
+         (sizeof (type), (base), &(cur), (cnt));               \
+      init ((base) + (ocur_), (cur) - ocur_);                  \
+    }
 
-static void
-event (W w, int events)
+#if 0
+#define array_slim(type,stem)                                  \
+  if (stem ## max < array_roundsize (stem ## cnt >> 2))                \
+    {                                                          \
+      stem ## max = array_roundsize (stem ## cnt >> 1);                \
+      base = (type *)ev_realloc (base, sizeof (type) * (stem ## max));\
+      fprintf (stderr, "slimmed down " # stem " to %d\n", stem ## max);/*D*/\
+    }
+#endif
+
+#define array_free(stem, idx) \
+  ev_free (stem ## s idx); stem ## cnt idx = stem ## max idx = 0;
+
+/*****************************************************************************/
+
+void noinline
+ev_feed_event (EV_P_ void *w, int revents)
 {
-  if (w->pending)
+  W w_ = (W)w;
+  int pri = ABSPRI (w_);
+
+  if (expect_false (w_->pending))
+    pendings [pri][w_->pending - 1].events |= revents;
+  else
     {
-      pendings [ABSPRI (w)][w->pending - 1].events |= events;
-      return;
+      w_->pending = ++pendingcnt [pri];
+      array_needsize (ANPENDING, pendings [pri], pendingmax [pri], w_->pending, EMPTY2);
+      pendings [pri][w_->pending - 1].w      = w_;
+      pendings [pri][w_->pending - 1].events = revents;
     }
-
-  w->pending = ++pendingcnt [ABSPRI (w)];
-  array_needsize (pendings [ABSPRI (w)], pendingmax [ABSPRI (w)], pendingcnt [ABSPRI (w)], );
-  pendings [ABSPRI (w)][w->pending - 1].w      = w;
-  pendings [ABSPRI (w)][w->pending - 1].events = events;
 }
 
-static void
-queue_events (W *events, int eventcnt, int type)
+void inline_speed
+queue_events (EV_P_ W *events, int eventcnt, int type)
 {
   int i;
 
   for (i = 0; i < eventcnt; ++i)
-    event (events [i], type);
+    ev_feed_event (EV_A_ events [i], type);
 }
 
-static void
-fd_event (int fd, int events)
+/*****************************************************************************/
+
+void inline_size
+anfds_init (ANFD *base, int count)
+{
+  while (count--)
+    {
+      base->head   = 0;
+      base->events = EV_NONE;
+      base->reify  = 0;
+
+      ++base;
+    }
+}
+
+void inline_speed
+fd_event (EV_P_ int fd, int revents)
 {
   ANFD *anfd = anfds + fd;
-  struct ev_io *w;
+  ev_io *w;
 
-  for (w = anfd->head; w; w = w->next)
+  for (w = (ev_io *)anfd->head; w; w = (ev_io *)((WL)w)->next)
     {
-      int ev = w->events & events;
+      int ev = w->events & revents;
 
       if (ev)
-        event ((W)w, ev);
+        ev_feed_event (EV_A_ (W)w, ev);
     }
 }
 
-/*****************************************************************************/
-
-static int *fdchanges;
-static int fdchangemax, fdchangecnt;
+void
+ev_feed_fd_event (EV_P_ int fd, int revents)
+{
+  if (fd >= 0 && fd < anfdmax)
+    fd_event (EV_A_ fd, revents);
+}
 
-static void
-fd_reify (void)
+void inline_size
+fd_reify (EV_P)
 {
   int i;
 
@@ -254,132 +579,176 @@ fd_reify (void)
     {
       int fd = fdchanges [i];
       ANFD *anfd = anfds + fd;
-      struct ev_io *w;
+      ev_io *w;
 
-      int events = 0;
+      unsigned char events = 0;
 
-      for (w = anfd->head; w; w = w->next)
-        events |= w->events;
+      for (w = (ev_io *)anfd->head; w; w = (ev_io *)((WL)w)->next)
+        events |= (unsigned char)w->events;
 
-      anfd->reify = 0;
-
-      if (anfd->events != events)
+#if EV_SELECT_IS_WINSOCKET
+      if (events)
         {
-          method_modify (fd, anfd->events, events);
-          anfd->events = events;
+          unsigned long argp;
+          anfd->handle = _get_osfhandle (fd);
+          assert (("libev only supports socket fds in this configuration", ioctlsocket (anfd->handle, FIONREAD, &argp) == 0));
         }
+#endif
+
+      {
+        unsigned char o_events = anfd->events;
+        unsigned char o_reify  = anfd->reify;
+
+        anfd->reify  = 0;
+        anfd->events = events;
+
+        if (o_events != events || o_reify & EV_IOFDSET)
+          backend_modify (EV_A_ fd, o_events, events);
+      }
     }
 
   fdchangecnt = 0;
 }
 
-static void
-fd_change (int fd)
+void inline_size
+fd_change (EV_P_ int fd, int flags)
 {
-  if (anfds [fd].reify || fdchangecnt < 0)
-    return;
-
-  anfds [fd].reify = 1;
+  unsigned char reify = anfds [fd].reify;
+  anfds [fd].reify |= flags;
 
-  ++fdchangecnt;
-  array_needsize (fdchanges, fdchangemax, fdchangecnt, );
-  fdchanges [fdchangecnt - 1] = fd;
+  if (expect_true (!reify))
+    {
+      ++fdchangecnt;
+      array_needsize (int, fdchanges, fdchangemax, fdchangecnt, EMPTY2);
+      fdchanges [fdchangecnt - 1] = fd;
+    }
 }
 
-static void
-fd_kill (int fd)
+void inline_speed
+fd_kill (EV_P_ int fd)
 {
-  struct ev_io *w;
+  ev_io *w;
 
-  printf ("killing fd %d\n", fd);//D
-  while ((w = anfds [fd].head))
+  while ((w = (ev_io *)anfds [fd].head))
     {
-      ev_io_stop (w);
-      event ((W)w, EV_ERROR | EV_READ | EV_WRITE);
+      ev_io_stop (EV_A_ w);
+      ev_feed_event (EV_A_ (W)w, EV_ERROR | EV_READ | EV_WRITE);
     }
 }
 
+int inline_size
+fd_valid (int fd)
+{
+#ifdef _WIN32
+  return _get_osfhandle (fd) != -1;
+#else
+  return fcntl (fd, F_GETFD) != -1;
+#endif
+}
+
 /* called on EBADF to verify fds */
-static void
-fd_ebadf (void)
+static void noinline
+fd_ebadf (EV_P)
 {
   int fd;
 
   for (fd = 0; fd < anfdmax; ++fd)
     if (anfds [fd].events)
-      if (fcntl (fd, F_GETFD) == -1 && errno == EBADF)
-        fd_kill (fd);
+      if (!fd_valid (fd) == -1 && errno == EBADF)
+        fd_kill (EV_A_ fd);
 }
 
 /* called on ENOMEM in select/poll to kill some fds and retry */
-static void
-fd_enomem (void)
+static void noinline
+fd_enomem (EV_P)
 {
-  int fd = anfdmax;
+  int fd;
 
-  while (fd--)
+  for (fd = anfdmax; fd--; )
     if (anfds [fd].events)
       {
-        close (fd);
-        fd_kill (fd);
+        fd_kill (EV_A_ fd);
         return;
       }
 }
 
-/*****************************************************************************/
+/* usually called after fork if backend needs to re-arm all fds from scratch */
+static void noinline
+fd_rearm_all (EV_P)
+{
+  int fd;
 
-static struct ev_timer **timers;
-static int timermax, timercnt;
+  for (fd = 0; fd < anfdmax; ++fd)
+    if (anfds [fd].events)
+      {
+        anfds [fd].events = 0;
+        fd_change (EV_A_ fd, EV_IOFDSET | 1);
+      }
+}
 
-static struct ev_periodic **periodics;
-static int periodicmax, periodiccnt;
+/*****************************************************************************/
 
-static void
-upheap (WT *timers, int k)
+void inline_speed
+upheap (WT *heap, int k)
 {
-  WT w = timers [k];
+  WT w = heap [k];
 
-  while (k && timers [k >> 1]->at > w->at)
+  while (k)
     {
-      timers [k] = timers [k >> 1];
-      timers [k]->active = k + 1;
-      k >>= 1;
-    }
+      int p = (k - 1) >> 1;
 
-  timers [k] = w;
-  timers [k]->active = k + 1;
+      if (heap [p]->at <= w->at)
+        break;
+
+      heap [k] = heap [p];
+      ((W)heap [k])->active = k + 1;
+      k = p;
+    }
 
+  heap [k] = w;
+  ((W)heap [k])->active = k + 1;
 }
 
-static void
-downheap (WT *timers, int N, int k)
+void inline_speed
+downheap (WT *heap, int N, int k)
 {
-  WT w = timers [k];
+  WT w = heap [k];
 
-  while (k < (N >> 1))
+  for (;;)
     {
-      int j = k << 1;
+      int c = (k << 1) + 1;
 
-      if (j + 1 < N && timers [j]->at > timers [j + 1]->at)
-        ++j;
+      if (c >= N)
+        break;
+
+      c += c + 1 < N && heap [c]->at > heap [c + 1]->at
+           ? 1 : 0;
 
-      if (w->at <= timers [j]->at)
+      if (w->at <= heap [c]->at)
         break;
 
-      timers [k] = timers [j];
-      timers [k]->active = k + 1;
-      k = j;
+      heap [k] = heap [c];
+      ((W)heap [k])->active = k + 1;
+
+      k = c;
     }
 
-  timers [k] = w;
-  timers [k]->active = k + 1;
+  heap [k] = w;
+  ((W)heap [k])->active = k + 1;
+}
+
+void inline_size
+adjustheap (WT *heap, int N, int k)
+{
+  upheap (heap, k);
+  downheap (heap, N, k);
 }
 
 /*****************************************************************************/
 
 typedef struct
 {
-  struct ev_signal *head;
+  WL head;
   sig_atomic_t volatile gotsig;
 } ANSIG;
 
@@ -388,9 +757,9 @@ static int signalmax;
 
 static int sigpipe [2];
 static sig_atomic_t volatile gotsig;
-static struct ev_io sigev;
+static ev_io sigev;
 
-static void
+void inline_size
 signals_init (ANSIG *base, int count)
 {
   while (count--)
@@ -405,19 +774,44 @@ signals_init (ANSIG *base, int count)
 static void
 sighandler (int signum)
 {
+#if _WIN32
+  signal (signum, sighandler);
+#endif
+
   signals [signum - 1].gotsig = 1;
 
   if (!gotsig)
     {
+      int old_errno = errno;
       gotsig = 1;
       write (sigpipe [1], &signum, 1);
+      errno = old_errno;
     }
 }
 
+void noinline
+ev_feed_signal_event (EV_P_ int signum)
+{
+  WL w;
+
+#if EV_MULTIPLICITY
+  assert (("feeding signal events is only supported in the default loop", loop == ev_default_loop_ptr));
+#endif
+
+  --signum;
+
+  if (signum < 0 || signum >= signalmax)
+    return;
+
+  signals [signum].gotsig = 0;
+
+  for (w = signals [signum].head; w; w = w->next)
+    ev_feed_event (EV_A_ (W)w, EV_SIGNAL);
+}
+
 static void
-sigcb (struct ev_io *iow, int revents)
+sigcb (EV_P_ ev_io *iow, int revents)
 {
-  struct ev_signal *w;
   int signum;
 
   read (sigpipe [0], &revents, 1);
@@ -425,65 +819,90 @@ sigcb (struct ev_io *iow, int revents)
 
   for (signum = signalmax; signum--; )
     if (signals [signum].gotsig)
-      {
-        signals [signum].gotsig = 0;
-
-        for (w = signals [signum].head; w; w = w->next)
-          event ((W)w, EV_SIGNAL);
-      }
+      ev_feed_signal_event (EV_A_ signum + 1);
 }
 
-static void
-siginit (void)
+void inline_speed
+fd_intern (int fd)
 {
-  fcntl (sigpipe [0], F_SETFD, FD_CLOEXEC);
-  fcntl (sigpipe [1], F_SETFD, FD_CLOEXEC);
+#ifdef _WIN32
+  int arg = 1;
+  ioctlsocket (_get_osfhandle (fd), FIONBIO, &arg);
+#else
+  fcntl (fd, F_SETFD, FD_CLOEXEC);
+  fcntl (fd, F_SETFL, O_NONBLOCK);
+#endif
+}
 
-  /* rather than sort out wether we really need nb, set it */
-  fcntl (sigpipe [0], F_SETFL, O_NONBLOCK);
-  fcntl (sigpipe [1], F_SETFL, O_NONBLOCK);
+static void noinline
+siginit (EV_P)
+{
+  fd_intern (sigpipe [0]);
+  fd_intern (sigpipe [1]);
 
   ev_io_set (&sigev, sigpipe [0], EV_READ);
-  ev_io_start (&sigev);
+  ev_io_start (EV_A_ &sigev);
+  ev_unref (EV_A); /* child watcher should not keep loop alive */
 }
 
 /*****************************************************************************/
 
-static struct ev_idle **idles;
-static int idlemax, idlecnt;
+static WL childs [EV_PID_HASHSIZE];
 
-static struct ev_prepare **prepares;
-static int preparemax, preparecnt;
+#ifndef _WIN32
 
-static struct ev_check **checks;
-static int checkmax, checkcnt;
+static ev_signal childev;
 
-/*****************************************************************************/
+void inline_speed
+child_reap (EV_P_ ev_signal *sw, int chain, int pid, int status)
+{
+  ev_child *w;
 
-static struct ev_child *childs [PID_HASHSIZE];
-static struct ev_signal childev;
+  for (w = (ev_child *)childs [chain & (EV_PID_HASHSIZE - 1)]; w; w = (ev_child *)((WL)w)->next)
+    if (w->pid == pid || !w->pid)
+      {
+        ev_set_priority (w, ev_priority (sw)); /* need to do it *now* */
+        w->rpid    = pid;
+        w->rstatus = status;
+        ev_feed_event (EV_A_ (W)w, EV_CHILD);
+      }
+}
 
 #ifndef WCONTINUED
 # define WCONTINUED 0
 #endif
 
 static void
-childcb (struct ev_signal *sw, int revents)
+childcb (EV_P_ ev_signal *sw, int revents)
 {
-  struct ev_child *w;
   int pid, status;
 
-  while ((pid = waitpid (-1, &status, WNOHANG | WUNTRACED | WCONTINUED)) != -1)
-    for (w = childs [pid & (PID_HASHSIZE - 1)]; w; w = w->next)
-      if (w->pid == pid || !w->pid)
-        {
-          w->status = status;
-          event ((W)w, EV_CHILD);
-        }
+  /* some systems define WCONTINUED but then fail to support it (linux 2.4) */
+  if (0 >= (pid = waitpid (-1, &status, WNOHANG | WUNTRACED | WCONTINUED)))
+    if (!WCONTINUED
+        || errno != EINVAL
+        || 0 >= (pid = waitpid (-1, &status, WNOHANG | WUNTRACED)))
+      return;
+
+  /* make sure we are called again until all childs have been reaped */
+  /* we need to do it this way so that the callback gets called before we continue */
+  ev_feed_event (EV_A_ (W)sw, EV_SIGNAL);
+
+  child_reap (EV_A_ sw, pid, pid, status);
+  if (EV_PID_HASHSIZE > 1)
+    child_reap (EV_A_ sw, 0, pid, status); /* this might trigger a watcher twice, but feed_event catches that */
 }
 
+#endif
+
 /*****************************************************************************/
 
+#if EV_USE_PORT
+# include "ev_port.c"
+#endif
+#if EV_USE_KQUEUE
+# include "ev_kqueue.c"
+#endif
 #if EV_USE_EPOLL
 # include "ev_epoll.c"
 #endif
@@ -506,97 +925,347 @@ ev_version_minor (void)
   return EV_VERSION_MINOR;
 }
 
-/* return true if we are running with elevated privileges and ignore env variables */
-static int
-enable_secure ()
+/* return true if we are running with elevated privileges and should ignore env variables */
+int inline_size
+enable_secure (void)
 {
+#ifdef _WIN32
+  return 0;
+#else
   return getuid () != geteuid ()
       || getgid () != getegid ();
+#endif
 }
 
-int ev_init (int methods)
+unsigned int
+ev_supported_backends (void)
 {
-  if (!ev_method)
-    {
-#if EV_USE_MONOTONIC
-      {
-        struct timespec ts;
+  unsigned int flags = 0;
+
+  if (EV_USE_PORT  ) flags |= EVBACKEND_PORT;
+  if (EV_USE_KQUEUE) flags |= EVBACKEND_KQUEUE;
+  if (EV_USE_EPOLL ) flags |= EVBACKEND_EPOLL;
+  if (EV_USE_POLL  ) flags |= EVBACKEND_POLL;
+  if (EV_USE_SELECT) flags |= EVBACKEND_SELECT;
+  
+  return flags;
+}
+
+unsigned int
+ev_recommended_backends (void)
+{
+  unsigned int flags = ev_supported_backends ();
+
+#ifndef __NetBSD__
+  /* kqueue is borked on everything but netbsd apparently */
+  /* it usually doesn't work correctly on anything but sockets and pipes */
+  flags &= ~EVBACKEND_KQUEUE;
+#endif
+#ifdef __APPLE__
+  // flags &= ~EVBACKEND_KQUEUE; for documentation
+  flags &= ~EVBACKEND_POLL;
+#endif
+
+  return flags;
+}
+
+unsigned int
+ev_embeddable_backends (void)
+{
+  /* epoll embeddability broken on all linux versions up to at least 2.6.23 */
+  return EVBACKEND_KQUEUE
+       | EVBACKEND_PORT;
+}
+
+unsigned int
+ev_backend (EV_P)
+{
+  return backend;
+}
+
+unsigned int
+ev_loop_count (EV_P)
+{
+  return loop_count;
+}
+
+void
+ev_set_io_collect_interval (EV_P_ ev_tstamp interval)
+{
+  io_blocktime = interval;
+}
+
+void
+ev_set_timeout_collect_interval (EV_P_ ev_tstamp interval)
+{
+  timeout_blocktime = interval;
+}
+
+static void noinline
+loop_init (EV_P_ unsigned int flags)
+{
+  if (!backend)
+    {
+#if EV_USE_MONOTONIC
+      {
+        struct timespec ts;
         if (!clock_gettime (CLOCK_MONOTONIC, &ts))
           have_monotonic = 1;
       }
 #endif
 
-      ev_now    = ev_time ();
-      now       = get_clock ();
-      now_floor = now;
-      diff      = ev_now - now;
+      ev_rt_now = ev_time ();
+      mn_now    = get_clock ();
+      now_floor = mn_now;
+      rtmn_diff = ev_rt_now - mn_now;
 
-      if (pipe (sigpipe))
-        return 0;
+      io_blocktime      = 0.;
+      timeout_blocktime = 0.;
 
-      if (methods == EVMETHOD_AUTO)
-          if (!enable_secure () && getenv ("LIBEV_METHODS"))
-            methods = atoi (getenv ("LIBEV_METHODS"));
-          else
-            methods = EVMETHOD_ANY;
+      /* pid check not overridable via env */
+#ifndef _WIN32
+      if (flags & EVFLAG_FORKCHECK)
+        curpid = getpid ();
+#endif
+
+      if (!(flags & EVFLAG_NOENV)
+          && !enable_secure ()
+          && getenv ("LIBEV_FLAGS"))
+        flags = atoi (getenv ("LIBEV_FLAGS"));
+
+      if (!(flags & 0x0000ffffUL))
+        flags |= ev_recommended_backends ();
+
+      backend = 0;
+      backend_fd = -1;
+#if EV_USE_INOTIFY
+      fs_fd = -2;
+#endif
 
-      ev_method = 0;
+#if EV_USE_PORT
+      if (!backend && (flags & EVBACKEND_PORT  )) backend = port_init   (EV_A_ flags);
+#endif
+#if EV_USE_KQUEUE
+      if (!backend && (flags & EVBACKEND_KQUEUE)) backend = kqueue_init (EV_A_ flags);
+#endif
 #if EV_USE_EPOLL
-      if (!ev_method && (methods & EVMETHOD_EPOLL )) epoll_init  (methods);
+      if (!backend && (flags & EVBACKEND_EPOLL )) backend = epoll_init  (EV_A_ flags);
 #endif
 #if EV_USE_POLL
-      if (!ev_method && (methods & EVMETHOD_POLL  )) poll_init   (methods);
+      if (!backend && (flags & EVBACKEND_POLL  )) backend = poll_init   (EV_A_ flags);
 #endif
 #if EV_USE_SELECT
-      if (!ev_method && (methods & EVMETHOD_SELECT)) select_init (methods);
+      if (!backend && (flags & EVBACKEND_SELECT)) backend = select_init (EV_A_ flags);
 #endif
 
-      if (ev_method)
-        {
-          ev_watcher_init (&sigev, sigcb);
-          siginit ();
+      ev_init (&sigev, sigcb);
+      ev_set_priority (&sigev, EV_MAXPRI);
+    }
+}
 
-          ev_signal_init (&childev, childcb, SIGCHLD);
-          ev_signal_start (&childev);
-        }
+static void noinline
+loop_destroy (EV_P)
+{
+  int i;
+
+#if EV_USE_INOTIFY
+  if (fs_fd >= 0)
+    close (fs_fd);
+#endif
+
+  if (backend_fd >= 0)
+    close (backend_fd);
+
+#if EV_USE_PORT
+  if (backend == EVBACKEND_PORT  ) port_destroy   (EV_A);
+#endif
+#if EV_USE_KQUEUE
+  if (backend == EVBACKEND_KQUEUE) kqueue_destroy (EV_A);
+#endif
+#if EV_USE_EPOLL
+  if (backend == EVBACKEND_EPOLL ) epoll_destroy  (EV_A);
+#endif
+#if EV_USE_POLL
+  if (backend == EVBACKEND_POLL  ) poll_destroy   (EV_A);
+#endif
+#if EV_USE_SELECT
+  if (backend == EVBACKEND_SELECT) select_destroy (EV_A);
+#endif
+
+  for (i = NUMPRI; i--; )
+    {
+      array_free (pending, [i]);
+#if EV_IDLE_ENABLE
+      array_free (idle, [i]);
+#endif
     }
 
-  return ev_method;
+  ev_free (anfds); anfdmax = 0;
+
+  /* have to use the microsoft-never-gets-it-right macro */
+  array_free (fdchange, EMPTY);
+  array_free (timer, EMPTY);
+#if EV_PERIODIC_ENABLE
+  array_free (periodic, EMPTY);
+#endif
+#if EV_FORK_ENABLE
+  array_free (fork, EMPTY);
+#endif
+  array_free (prepare, EMPTY);
+  array_free (check, EMPTY);
+
+  backend = 0;
 }
 
-/*****************************************************************************/
+void inline_size infy_fork (EV_P);
+
+void inline_size
+loop_fork (EV_P)
+{
+#if EV_USE_PORT
+  if (backend == EVBACKEND_PORT  ) port_fork   (EV_A);
+#endif
+#if EV_USE_KQUEUE
+  if (backend == EVBACKEND_KQUEUE) kqueue_fork (EV_A);
+#endif
+#if EV_USE_EPOLL
+  if (backend == EVBACKEND_EPOLL ) epoll_fork  (EV_A);
+#endif
+#if EV_USE_INOTIFY
+  infy_fork (EV_A);
+#endif
+
+  if (ev_is_active (&sigev))
+    {
+      /* default loop */
+
+      ev_ref (EV_A);
+      ev_io_stop (EV_A_ &sigev);
+      close (sigpipe [0]);
+      close (sigpipe [1]);
+
+      while (pipe (sigpipe))
+        syserr ("(libev) error creating pipe");
+
+      siginit (EV_A);
+    }
+
+  postfork = 0;
+}
+
+#if EV_MULTIPLICITY
+struct ev_loop *
+ev_loop_new (unsigned int flags)
+{
+  struct ev_loop *loop = (struct ev_loop *)ev_malloc (sizeof (struct ev_loop));
+
+  memset (loop, 0, sizeof (struct ev_loop));
+
+  loop_init (EV_A_ flags);
+
+  if (ev_backend (EV_A))
+    return loop;
+
+  return 0;
+}
 
 void
-ev_fork_prepare (void)
+ev_loop_destroy (EV_P)
 {
-  /* nop */
+  loop_destroy (EV_A);
+  ev_free (loop);
 }
 
 void
-ev_fork_parent (void)
+ev_loop_fork (EV_P)
 {
-  /* nop */
+  postfork = 1;
+}
+
+#endif
+
+#if EV_MULTIPLICITY
+struct ev_loop *
+ev_default_loop_init (unsigned int flags)
+#else
+int
+ev_default_loop (unsigned int flags)
+#endif
+{
+  if (sigpipe [0] == sigpipe [1])
+    if (pipe (sigpipe))
+      return 0;
+
+  if (!ev_default_loop_ptr)
+    {
+#if EV_MULTIPLICITY
+      struct ev_loop *loop = ev_default_loop_ptr = &default_loop_struct;
+#else
+      ev_default_loop_ptr = 1;
+#endif
+
+      loop_init (EV_A_ flags);
+
+      if (ev_backend (EV_A))
+        {
+          siginit (EV_A);
+
+#ifndef _WIN32
+          ev_signal_init (&childev, childcb, SIGCHLD);
+          ev_set_priority (&childev, EV_MAXPRI);
+          ev_signal_start (EV_A_ &childev);
+          ev_unref (EV_A); /* child watcher should not keep loop alive */
+#endif
+        }
+      else
+        ev_default_loop_ptr = 0;
+    }
+
+  return ev_default_loop_ptr;
 }
 
 void
-ev_fork_child (void)
+ev_default_destroy (void)
 {
-#if EV_USE_EPOLL
-  if (ev_method == EVMETHOD_EPOLL)
-    epoll_postfork_child ();
+#if EV_MULTIPLICITY
+  struct ev_loop *loop = ev_default_loop_ptr;
+#endif
+
+#ifndef _WIN32
+  ev_ref (EV_A); /* child watcher */
+  ev_signal_stop (EV_A_ &childev);
+#endif
+
+  ev_ref (EV_A); /* signal watcher */
+  ev_io_stop (EV_A_ &sigev);
+
+  close (sigpipe [0]); sigpipe [0] = 0;
+  close (sigpipe [1]); sigpipe [1] = 0;
+
+  loop_destroy (EV_A);
+}
+
+void
+ev_default_fork (void)
+{
+#if EV_MULTIPLICITY
+  struct ev_loop *loop = ev_default_loop_ptr;
 #endif
 
-  ev_io_stop (&sigev);
-  close (sigpipe [0]);
-  close (sigpipe [1]);
-  pipe (sigpipe);
-  siginit ();
+  if (backend)
+    postfork = 1;
 }
 
 /*****************************************************************************/
 
-static void
-call_pending (void)
+void
+ev_invoke (EV_P_ void *w, int revents)
+{
+  EV_CB_INVOKE ((W)w, revents);
+}
+
+void inline_speed
+call_pending (EV_P)
 {
   int pri;
 
@@ -605,234 +1274,336 @@ call_pending (void)
       {
         ANPENDING *p = pendings [pri] + --pendingcnt [pri];
 
-        if (p->w)
+        if (expect_true (p->w))
           {
+            /*assert (("non-pending watcher on pending list", p->w->pending));*/
+
             p->w->pending = 0;
-            p->w->cb (p->w, p->events);
+            EV_CB_INVOKE (p->w, p->events);
           }
       }
 }
 
-static void
-timers_reify (void)
+void inline_size
+timers_reify (EV_P)
 {
-  while (timercnt && timers [0]->at <= now)
+  while (timercnt && ((WT)timers [0])->at <= mn_now)
     {
-      struct ev_timer *w = timers [0];
+      ev_timer *w = (ev_timer *)timers [0];
+
+      /*assert (("inactive timer on timer heap detected", ev_is_active (w)));*/
 
       /* first reschedule or stop timer */
       if (w->repeat)
         {
           assert (("negative ev_timer repeat value found while processing timers", w->repeat > 0.));
-          w->at = now + w->repeat;
-          downheap ((WT *)timers, timercnt, 0);
+
+          ((WT)w)->at += w->repeat;
+          if (((WT)w)->at < mn_now)
+            ((WT)w)->at = mn_now;
+
+          downheap (timers, timercnt, 0);
         }
       else
-        ev_timer_stop (w); /* nonrepeating: stop timer */
+        ev_timer_stop (EV_A_ w); /* nonrepeating: stop timer */
 
-      event ((W)w, EV_TIMEOUT);
+      ev_feed_event (EV_A_ (W)w, EV_TIMEOUT);
     }
 }
 
-static void
-periodics_reify (void)
+#if EV_PERIODIC_ENABLE
+void inline_size
+periodics_reify (EV_P)
 {
-  while (periodiccnt && periodics [0]->at <= ev_now)
+  while (periodiccnt && ((WT)periodics [0])->at <= ev_rt_now)
     {
-      struct ev_periodic *w = periodics [0];
+      ev_periodic *w = (ev_periodic *)periodics [0];
+
+      /*assert (("inactive timer on periodic heap detected", ev_is_active (w)));*/
 
       /* first reschedule or stop timer */
-      if (w->interval)
+      if (w->reschedule_cb)
         {
-          w->at += floor ((ev_now - w->at) / w->interval + 1.) * w->interval;
-          assert (("ev_periodic timeout in the past detected while processing timers, negative interval?", w->at > ev_now));
-          downheap ((WT *)periodics, periodiccnt, 0);
+          ((WT)w)->at = w->reschedule_cb (w, ev_rt_now + TIME_EPSILON);
+          assert (("ev_periodic reschedule callback returned time in the past", ((WT)w)->at > ev_rt_now));
+          downheap (periodics, periodiccnt, 0);
+        }
+      else if (w->interval)
+        {
+          ((WT)w)->at = w->offset + ceil ((ev_rt_now - w->offset) / w->interval) * w->interval;
+          if (((WT)w)->at - ev_rt_now <= TIME_EPSILON) ((WT)w)->at += w->interval;
+          assert (("ev_periodic timeout in the past detected while processing timers, negative interval?", ((WT)w)->at > ev_rt_now));
+          downheap (periodics, periodiccnt, 0);
         }
       else
-        ev_periodic_stop (w); /* nonrepeating: stop timer */
+        ev_periodic_stop (EV_A_ w); /* nonrepeating: stop timer */
 
-      event ((W)w, EV_PERIODIC);
+      ev_feed_event (EV_A_ (W)w, EV_PERIODIC);
     }
 }
 
-static void
-periodics_reschedule (ev_tstamp diff)
+static void noinline
+periodics_reschedule (EV_P)
 {
   int i;
 
   /* adjust periodics after time jump */
   for (i = 0; i < periodiccnt; ++i)
     {
-      struct ev_periodic *w = periodics [i];
+      ev_periodic *w = (ev_periodic *)periodics [i];
 
-      if (w->interval)
-        {
-          ev_tstamp diff = ceil ((ev_now - w->at) / w->interval) * w->interval;
-
-          if (fabs (diff) >= 1e-4)
-            {
-              ev_periodic_stop (w);
-              ev_periodic_start (w);
-
-              i = 0; /* restart loop, inefficient, but time jumps should be rare */
-            }
-        }
+      if (w->reschedule_cb)
+        ((WT)w)->at = w->reschedule_cb (w, ev_rt_now);
+      else if (w->interval)
+        ((WT)w)->at = w->offset + ceil ((ev_rt_now - w->offset) / w->interval) * w->interval;
     }
+
+  /* now rebuild the heap */
+  for (i = periodiccnt >> 1; i--; )
+    downheap (periodics, periodiccnt, i);
 }
+#endif
 
-static int
-time_update_monotonic (void)
+#if EV_IDLE_ENABLE
+void inline_size
+idle_reify (EV_P)
 {
-  now = get_clock ();
-
-  if (expect_true (now - now_floor < MIN_TIMEJUMP * .5))
-    {
-      ev_now = now + diff;
-      return 0;
-    }
-  else
+  if (expect_false (idleall))
     {
-      now_floor = now;
-      ev_now = ev_time ();
-      return 1;
+      int pri;
+
+      for (pri = NUMPRI; pri--; )
+        {
+          if (pendingcnt [pri])
+            break;
+
+          if (idlecnt [pri])
+            {
+              queue_events (EV_A_ (W *)idles [pri], idlecnt [pri], EV_IDLE);
+              break;
+            }
+        }
     }
 }
+#endif
 
-static void
-time_update (void)
+void inline_speed
+time_update (EV_P_ ev_tstamp max_block)
 {
   int i;
 
 #if EV_USE_MONOTONIC
   if (expect_true (have_monotonic))
     {
-      if (time_update_monotonic ())
-        {
-          ev_tstamp odiff = diff;
+      ev_tstamp odiff = rtmn_diff;
 
-          for (i = 4; --i; ) /* loop a few times, before making important decisions */
-            {
-              diff = ev_now - now;
+      mn_now = get_clock ();
 
-              if (fabs (odiff - diff) < MIN_TIMEJUMP)
-                return; /* all is well */
+      /* only fetch the realtime clock every 0.5*MIN_TIMEJUMP seconds */
+      /* interpolate in the meantime */
+      if (expect_true (mn_now - now_floor < MIN_TIMEJUMP * .5))
+        {
+          ev_rt_now = rtmn_diff + mn_now;
+          return;
+        }
 
-              ev_now    = ev_time ();
-              now       = get_clock ();
-              now_floor = now;
-            }
+      now_floor = mn_now;
+      ev_rt_now = ev_time ();
+
+      /* loop a few times, before making important decisions.
+       * on the choice of "4": one iteration isn't enough,
+       * in case we get preempted during the calls to
+       * ev_time and get_clock. a second call is almost guaranteed
+       * to succeed in that case, though. and looping a few more times
+       * doesn't hurt either as we only do this on time-jumps or
+       * in the unlikely event of having been preempted here.
+       */
+      for (i = 4; --i; )
+        {
+          rtmn_diff = ev_rt_now - mn_now;
+
+          if (fabs (odiff - rtmn_diff) < MIN_TIMEJUMP)
+            return; /* all is well */
 
-          periodics_reschedule (diff - odiff);
-          /* no timer adjustment, as the monotonic clock doesn't jump */
+          ev_rt_now = ev_time ();
+          mn_now    = get_clock ();
+          now_floor = mn_now;
         }
+
+# if EV_PERIODIC_ENABLE
+      periodics_reschedule (EV_A);
+# endif
+      /* no timer adjustment, as the monotonic clock doesn't jump */
+      /* timers_reschedule (EV_A_ rtmn_diff - odiff) */
     }
   else
 #endif
     {
-      ev_now = ev_time ();
+      ev_rt_now = ev_time ();
 
-      if (expect_false (now > ev_now || now < ev_now - MAX_BLOCKTIME - MIN_TIMEJUMP))
+      if (expect_false (mn_now > ev_rt_now || ev_rt_now > mn_now + max_block + MIN_TIMEJUMP))
         {
-          periodics_reschedule (ev_now - now);
-
-          /* adjust timers. this is easy, as the offset is the same for all */
+#if EV_PERIODIC_ENABLE
+          periodics_reschedule (EV_A);
+#endif
+          /* adjust timers. this is easy, as the offset is the same for all of them */
           for (i = 0; i < timercnt; ++i)
-            timers [i]->at += diff;
+            ((WT)timers [i])->at += ev_rt_now - mn_now;
         }
 
-      now = ev_now;
+      mn_now = ev_rt_now;
     }
 }
 
-int ev_loop_done;
+void
+ev_ref (EV_P)
+{
+  ++activecnt;
+}
 
-void ev_loop (int flags)
+void
+ev_unref (EV_P)
 {
-  double block;
-  ev_loop_done = flags & (EVLOOP_ONESHOT | EVLOOP_NONBLOCK) ? 1 : 0;
+  --activecnt;
+}
+
+static int loop_done;
+
+void
+ev_loop (EV_P_ int flags)
+{
+  loop_done = flags & (EVLOOP_ONESHOT | EVLOOP_NONBLOCK)
+            ? EVUNLOOP_ONE
+            : EVUNLOOP_CANCEL;
+
+  call_pending (EV_A); /* in case we recurse, ensure ordering stays nice and clean */
 
   do
     {
-      /* queue check watchers (and execute them) */
+#ifndef _WIN32
+      if (expect_false (curpid)) /* penalise the forking check even more */
+        if (expect_false (getpid () != curpid))
+          {
+            curpid = getpid ();
+            postfork = 1;
+          }
+#endif
+
+#if EV_FORK_ENABLE
+      /* we might have forked, so queue fork handlers */
+      if (expect_false (postfork))
+        if (forkcnt)
+          {
+            queue_events (EV_A_ (W *)forks, forkcnt, EV_FORK);
+            call_pending (EV_A);
+          }
+#endif
+
+      /* queue prepare watchers (and execute them) */
       if (expect_false (preparecnt))
         {
-          queue_events ((W *)prepares, preparecnt, EV_PREPARE);
-          call_pending ();
+          queue_events (EV_A_ (W *)prepares, preparecnt, EV_PREPARE);
+          call_pending (EV_A);
         }
 
+      if (expect_false (!activecnt))
+        break;
+
+      /* we might have forked, so reify kernel state if necessary */
+      if (expect_false (postfork))
+        loop_fork (EV_A);
+
       /* update fd-related kernel structures */
-      fd_reify ();
+      fd_reify (EV_A);
 
       /* calculate blocking time */
+      {
+        ev_tstamp waittime  = 0.;
+        ev_tstamp sleeptime = 0.;
 
-      /* we only need this for !monotonic clockor timers, but as we basically
-         always have timers, we just calculate it always */
-#if EV_USE_MONOTONIC
-      if (expect_true (have_monotonic))
-        time_update_monotonic ();
-      else
+        if (expect_true (!(flags & EVLOOP_NONBLOCK || idleall || !activecnt)))
+          {
+            /* update time to cancel out callback processing overhead */
+            time_update (EV_A_ 1e100);
+
+            waittime = MAX_BLOCKTIME;
+
+            if (timercnt)
+              {
+                ev_tstamp to = ((WT)timers [0])->at - mn_now + backend_fudge;
+                if (waittime > to) waittime = to;
+              }
+
+#if EV_PERIODIC_ENABLE
+            if (periodiccnt)
+              {
+                ev_tstamp to = ((WT)periodics [0])->at - ev_rt_now + backend_fudge;
+                if (waittime > to) waittime = to;
+              }
 #endif
-        {
-          ev_now = ev_time ();
-          now    = ev_now;
-        }
 
-      if (flags & EVLOOP_NONBLOCK || idlecnt)
-        block = 0.;
-      else
-        {
-          block = MAX_BLOCKTIME;
+            if (expect_false (waittime < timeout_blocktime))
+              waittime = timeout_blocktime;
 
-          if (timercnt)
-            {
-              ev_tstamp to = timers [0]->at - now + method_fudge;
-              if (block > to) block = to;
-            }
+            sleeptime = waittime - backend_fudge;
 
-          if (periodiccnt)
-            {
-              ev_tstamp to = periodics [0]->at - ev_now + method_fudge;
-              if (block > to) block = to;
-            }
+            if (expect_true (sleeptime > io_blocktime))
+              sleeptime = io_blocktime;
 
-          if (block < 0.) block = 0.;
-        }
+            if (sleeptime)
+              {
+                ev_sleep (sleeptime);
+                waittime -= sleeptime;
+              }
+          }
 
-      method_poll (block);
+        ++loop_count;
+        backend_poll (EV_A_ waittime);
 
-      /* update ev_now, do magic */
-      time_update ();
+        /* update ev_rt_now, do magic */
+        time_update (EV_A_ waittime + sleeptime);
+      }
 
       /* queue pending timers and reschedule them */
-      timers_reify (); /* relative timers called last */
-      periodics_reify (); /* absolute timers called first */
+      timers_reify (EV_A); /* relative timers called last */
+#if EV_PERIODIC_ENABLE
+      periodics_reify (EV_A); /* absolute timers called first */
+#endif
 
-      /* queue idle watchers unless io or timers are pending */
-      if (!pendingcnt)
-        queue_events ((W *)idles, idlecnt, EV_IDLE);
+#if EV_IDLE_ENABLE
+      /* queue idle watchers unless other events are pending */
+      idle_reify (EV_A);
+#endif
 
       /* queue check watchers, to be executed first */
-      if (checkcnt)
-        queue_events ((W *)checks, checkcnt, EV_CHECK);
+      if (expect_false (checkcnt))
+        queue_events (EV_A_ (W *)checks, checkcnt, EV_CHECK);
+
+      call_pending (EV_A);
 
-      call_pending ();
     }
-  while (!ev_loop_done);
+  while (expect_true (activecnt && !loop_done));
 
-  if (ev_loop_done != 2)
-    ev_loop_done = 0;
+  if (loop_done == EVUNLOOP_ONE)
+    loop_done = EVUNLOOP_CANCEL;
+}
+
+void
+ev_unloop (EV_P_ int how)
+{
+  loop_done = how;
 }
 
 /*****************************************************************************/
 
-static void
+void inline_size
 wlist_add (WL *head, WL elem)
 {
   elem->next = *head;
   *head = elem;
 }
 
-static void
+void inline_size
 wlist_del (WL *head, WL elem)
 {
   while (*head)
@@ -847,8 +1618,8 @@ wlist_del (WL *head, WL elem)
     }
 }
 
-static void
-ev_clear_pending (W w)
+void inline_speed
+clear_pending (EV_P_ W w)
 {
   if (w->pending)
     {
@@ -857,404 +1628,789 @@ ev_clear_pending (W w)
     }
 }
 
-static void
-ev_start (W w, int active)
+int
+ev_clear_pending (EV_P_ void *w)
 {
-  if (w->priority < EV_MINPRI) w->priority = EV_MINPRI;
-  if (w->priority > EV_MAXPRI) w->priority = EV_MAXPRI;
+  W w_ = (W)w;
+  int pending = w_->pending;
 
+  if (expect_true (pending))
+    {
+      ANPENDING *p = pendings [ABSPRI (w_)] + pending - 1;
+      w_->pending = 0;
+      p->w = 0;
+      return p->events;
+    }
+  else
+    return 0;
+}
+
+void inline_size
+pri_adjust (EV_P_ W w)
+{
+  int pri = w->priority;
+  pri = pri < EV_MINPRI ? EV_MINPRI : pri;
+  pri = pri > EV_MAXPRI ? EV_MAXPRI : pri;
+  w->priority = pri;
+}
+
+void inline_speed
+ev_start (EV_P_ W w, int active)
+{
+  pri_adjust (EV_A_ w);
   w->active = active;
+  ev_ref (EV_A);
 }
 
-static void
-ev_stop (W w)
+void inline_size
+ev_stop (EV_P_ W w)
 {
+  ev_unref (EV_A);
   w->active = 0;
 }
 
 /*****************************************************************************/
 
-void
-ev_io_start (struct ev_io *w)
+void noinline
+ev_io_start (EV_P_ ev_io *w)
 {
   int fd = w->fd;
 
-  if (ev_is_active (w))
+  if (expect_false (ev_is_active (w)))
     return;
 
   assert (("ev_io_start called with negative fd", fd >= 0));
 
-  ev_start ((W)w, 1);
-  array_needsize (anfds, anfdmax, fd + 1, anfds_init);
-  wlist_add ((WL *)&anfds[fd].head, (WL)w);
+  ev_start (EV_A_ (W)w, 1);
+  array_needsize (ANFD, anfds, anfdmax, fd + 1, anfds_init);
+  wlist_add (&anfds[fd].head, (WL)w);
 
-  fd_change (fd);
+  fd_change (EV_A_ fd, w->events & EV_IOFDSET | 1);
+  w->events &= ~EV_IOFDSET;
 }
 
-void
-ev_io_stop (struct ev_io *w)
+void noinline
+ev_io_stop (EV_P_ ev_io *w)
 {
-  ev_clear_pending ((W)w);
-  if (!ev_is_active (w))
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
     return;
 
-  wlist_del ((WL *)&anfds[w->fd].head, (WL)w);
-  ev_stop ((W)w);
+  assert (("ev_io_start called with illegal fd (must stay constant after start!)", w->fd >= 0 && w->fd < anfdmax));
+
+  wlist_del (&anfds[w->fd].head, (WL)w);
+  ev_stop (EV_A_ (W)w);
 
-  fd_change (w->fd);
+  fd_change (EV_A_ w->fd, 1);
 }
 
-void
-ev_timer_start (struct ev_timer *w)
+void noinline
+ev_timer_start (EV_P_ ev_timer *w)
 {
-  if (ev_is_active (w))
+  if (expect_false (ev_is_active (w)))
     return;
 
-  w->at += now;
+  ((WT)w)->at += mn_now;
 
   assert (("ev_timer_start called with negative timer repeat value", w->repeat >= 0.));
 
-  ev_start ((W)w, ++timercnt);
-  array_needsize (timers, timermax, timercnt, );
-  timers [timercnt - 1] = w;
-  upheap ((WT *)timers, timercnt - 1);
+  ev_start (EV_A_ (W)w, ++timercnt);
+  array_needsize (WT, timers, timermax, timercnt, EMPTY2);
+  timers [timercnt - 1] = (WT)w;
+  upheap (timers, timercnt - 1);
+
+  /*assert (("internal timer heap corruption", timers [((W)w)->active - 1] == w));*/
 }
 
-void
-ev_timer_stop (struct ev_timer *w)
+void noinline
+ev_timer_stop (EV_P_ ev_timer *w)
 {
-  ev_clear_pending ((W)w);
-  if (!ev_is_active (w))
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
     return;
 
-  if (w->active < timercnt--)
-    {
-      timers [w->active - 1] = timers [timercnt];
-      downheap ((WT *)timers, timercnt, w->active - 1);
-    }
+  assert (("internal timer heap corruption", timers [((W)w)->active - 1] == (WT)w));
+
+  {
+    int active = ((W)w)->active;
 
-  w->at = w->repeat;
+    if (expect_true (--active < --timercnt))
+      {
+        timers [active] = timers [timercnt];
+        adjustheap (timers, timercnt, active);
+      }
+  }
 
-  ev_stop ((W)w);
+  ((WT)w)->at -= mn_now;
+
+  ev_stop (EV_A_ (W)w);
 }
 
-void
-ev_timer_again (struct ev_timer *w)
+void noinline
+ev_timer_again (EV_P_ ev_timer *w)
 {
   if (ev_is_active (w))
     {
       if (w->repeat)
         {
-          w->at = now + w->repeat;
-          downheap ((WT *)timers, timercnt, w->active - 1);
+          ((WT)w)->at = mn_now + w->repeat;
+          adjustheap (timers, timercnt, ((W)w)->active - 1);
         }
       else
-        ev_timer_stop (w);
+        ev_timer_stop (EV_A_ w);
     }
   else if (w->repeat)
-    ev_timer_start (w);
+    {
+      w->at = w->repeat;
+      ev_timer_start (EV_A_ w);
+    }
 }
 
-void
-ev_periodic_start (struct ev_periodic *w)
+#if EV_PERIODIC_ENABLE
+void noinline
+ev_periodic_start (EV_P_ ev_periodic *w)
 {
-  if (ev_is_active (w))
+  if (expect_false (ev_is_active (w)))
     return;
 
-  assert (("ev_periodic_start called with negative interval value", w->interval >= 0.));
+  if (w->reschedule_cb)
+    ((WT)w)->at = w->reschedule_cb (w, ev_rt_now);
+  else if (w->interval)
+    {
+      assert (("ev_periodic_start called with negative interval value", w->interval >= 0.));
+      /* this formula differs from the one in periodic_reify because we do not always round up */
+      ((WT)w)->at = w->offset + ceil ((ev_rt_now - w->offset) / w->interval) * w->interval;
+    }
+  else
+    ((WT)w)->at = w->offset;
 
-  /* this formula differs from the one in periodic_reify because we do not always round up */
-  if (w->interval)
-    w->at += ceil ((ev_now - w->at) / w->interval) * w->interval;
+  ev_start (EV_A_ (W)w, ++periodiccnt);
+  array_needsize (WT, periodics, periodicmax, periodiccnt, EMPTY2);
+  periodics [periodiccnt - 1] = (WT)w;
+  upheap (periodics, periodiccnt - 1);
 
-  ev_start ((W)w, ++periodiccnt);
-  array_needsize (periodics, periodicmax, periodiccnt, );
-  periodics [periodiccnt - 1] = w;
-  upheap ((WT *)periodics, periodiccnt - 1);
+  /*assert (("internal periodic heap corruption", periodics [((W)w)->active - 1] == w));*/
 }
 
-void
-ev_periodic_stop (struct ev_periodic *w)
+void noinline
+ev_periodic_stop (EV_P_ ev_periodic *w)
 {
-  ev_clear_pending ((W)w);
-  if (!ev_is_active (w))
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
     return;
 
-  if (w->active < periodiccnt--)
-    {
-      periodics [w->active - 1] = periodics [periodiccnt];
-      downheap ((WT *)periodics, periodiccnt, w->active - 1);
-    }
+  assert (("internal periodic heap corruption", periodics [((W)w)->active - 1] == (WT)w));
+
+  {
+    int active = ((W)w)->active;
 
-  ev_stop ((W)w);
+    if (expect_true (--active < --periodiccnt))
+      {
+        periodics [active] = periodics [periodiccnt];
+        adjustheap (periodics, periodiccnt, active);
+      }
+  }
+
+  ev_stop (EV_A_ (W)w);
 }
 
-void
-ev_signal_start (struct ev_signal *w)
+void noinline
+ev_periodic_again (EV_P_ ev_periodic *w)
 {
-  if (ev_is_active (w))
+  /* TODO: use adjustheap and recalculation */
+  ev_periodic_stop (EV_A_ w);
+  ev_periodic_start (EV_A_ w);
+}
+#endif
+
+#ifndef SA_RESTART
+# define SA_RESTART 0
+#endif
+
+void noinline
+ev_signal_start (EV_P_ ev_signal *w)
+{
+#if EV_MULTIPLICITY
+  assert (("signal watchers are only supported in the default loop", loop == ev_default_loop_ptr));
+#endif
+  if (expect_false (ev_is_active (w)))
     return;
 
   assert (("ev_signal_start called with illegal signal number", w->signum > 0));
 
-  ev_start ((W)w, 1);
-  array_needsize (signals, signalmax, w->signum, signals_init);
-  wlist_add ((WL *)&signals [w->signum - 1].head, (WL)w);
+  {
+#ifndef _WIN32
+    sigset_t full, prev;
+    sigfillset (&full);
+    sigprocmask (SIG_SETMASK, &full, &prev);
+#endif
+
+    array_needsize (ANSIG, signals, signalmax, w->signum, signals_init);
+
+#ifndef _WIN32
+    sigprocmask (SIG_SETMASK, &prev, 0);
+#endif
+  }
+
+  ev_start (EV_A_ (W)w, 1);
+  wlist_add (&signals [w->signum - 1].head, (WL)w);
 
-  if (!w->next)
+  if (!((WL)w)->next)
     {
+#if _WIN32
+      signal (w->signum, sighandler);
+#else
       struct sigaction sa;
       sa.sa_handler = sighandler;
       sigfillset (&sa.sa_mask);
-      sa.sa_flags = 0;
+      sa.sa_flags = SA_RESTART; /* if restarting works we save one iteration */
       sigaction (w->signum, &sa, 0);
+#endif
     }
 }
 
-void
-ev_signal_stop (struct ev_signal *w)
+void noinline
+ev_signal_stop (EV_P_ ev_signal *w)
 {
-  ev_clear_pending ((W)w);
-  if (!ev_is_active (w))
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
     return;
 
-  wlist_del ((WL *)&signals [w->signum - 1].head, (WL)w);
-  ev_stop ((W)w);
+  wlist_del (&signals [w->signum - 1].head, (WL)w);
+  ev_stop (EV_A_ (W)w);
 
   if (!signals [w->signum - 1].head)
     signal (w->signum, SIG_DFL);
 }
 
 void
-ev_idle_start (struct ev_idle *w)
+ev_child_start (EV_P_ ev_child *w)
 {
-  if (ev_is_active (w))
+#if EV_MULTIPLICITY
+  assert (("child watchers are only supported in the default loop", loop == ev_default_loop_ptr));
+#endif
+  if (expect_false (ev_is_active (w)))
     return;
 
-  ev_start ((W)w, ++idlecnt);
-  array_needsize (idles, idlemax, idlecnt, );
-  idles [idlecnt - 1] = w;
+  ev_start (EV_A_ (W)w, 1);
+  wlist_add (&childs [w->pid & (EV_PID_HASHSIZE - 1)], (WL)w);
 }
 
 void
-ev_idle_stop (struct ev_idle *w)
+ev_child_stop (EV_P_ ev_child *w)
 {
-  ev_clear_pending ((W)w);
-  if (ev_is_active (w))
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
     return;
 
-  idles [w->active - 1] = idles [--idlecnt];
-  ev_stop ((W)w);
+  wlist_del (&childs [w->pid & (EV_PID_HASHSIZE - 1)], (WL)w);
+  ev_stop (EV_A_ (W)w);
 }
 
-void
-ev_prepare_start (struct ev_prepare *w)
+#if EV_STAT_ENABLE
+
+# ifdef _WIN32
+#  undef lstat
+#  define lstat(a,b) _stati64 (a,b)
+# endif
+
+#define DEF_STAT_INTERVAL 5.0074891
+#define MIN_STAT_INTERVAL 0.1074891
+
+static void noinline stat_timer_cb (EV_P_ ev_timer *w_, int revents);
+
+#if EV_USE_INOTIFY
+# define EV_INOTIFY_BUFSIZE 8192
+
+static void noinline
+infy_add (EV_P_ ev_stat *w)
 {
-  if (ev_is_active (w))
+  w->wd = inotify_add_watch (fs_fd, w->path, IN_ATTRIB | IN_DELETE_SELF | IN_MOVE_SELF | IN_MODIFY | IN_DONT_FOLLOW | IN_MASK_ADD);
+
+  if (w->wd < 0)
+    {
+      ev_timer_start (EV_A_ &w->timer); /* this is not race-free, so we still need to recheck periodically */
+
+      /* monitor some parent directory for speedup hints */
+      if ((errno == ENOENT || errno == EACCES) && strlen (w->path) < 4096)
+        {
+          char path [4096];
+          strcpy (path, w->path);
+
+          do
+            {
+              int mask = IN_MASK_ADD | IN_DELETE_SELF | IN_MOVE_SELF
+                       | (errno == EACCES ? IN_ATTRIB : IN_CREATE | IN_MOVED_TO);
+
+              char *pend = strrchr (path, '/');
+
+              if (!pend)
+                break; /* whoops, no '/', complain to your admin */
+
+              *pend = 0;
+              w->wd = inotify_add_watch (fs_fd, path, mask);
+            } 
+          while (w->wd < 0 && (errno == ENOENT || errno == EACCES));
+        }
+    }
+  else
+    ev_timer_stop (EV_A_ &w->timer); /* we can watch this in a race-free way */
+
+  if (w->wd >= 0)
+    wlist_add (&fs_hash [w->wd & (EV_INOTIFY_HASHSIZE - 1)].head, (WL)w);
+}
+
+static void noinline
+infy_del (EV_P_ ev_stat *w)
+{
+  int slot;
+  int wd = w->wd;
+
+  if (wd < 0)
     return;
 
-  ev_start ((W)w, ++preparecnt);
-  array_needsize (prepares, preparemax, preparecnt, );
-  prepares [preparecnt - 1] = w;
+  w->wd = -2;
+  slot = wd & (EV_INOTIFY_HASHSIZE - 1);
+  wlist_del (&fs_hash [slot].head, (WL)w);
+
+  /* remove this watcher, if others are watching it, they will rearm */
+  inotify_rm_watch (fs_fd, wd);
+}
+
+static void noinline
+infy_wd (EV_P_ int slot, int wd, struct inotify_event *ev)
+{
+  if (slot < 0)
+    /* overflow, need to check for all hahs slots */
+    for (slot = 0; slot < EV_INOTIFY_HASHSIZE; ++slot)
+      infy_wd (EV_A_ slot, wd, ev);
+  else
+    {
+      WL w_;
+
+      for (w_ = fs_hash [slot & (EV_INOTIFY_HASHSIZE - 1)].head; w_; )
+        {
+          ev_stat *w = (ev_stat *)w_;
+          w_ = w_->next; /* lets us remove this watcher and all before it */
+
+          if (w->wd == wd || wd == -1)
+            {
+              if (ev->mask & (IN_IGNORED | IN_UNMOUNT | IN_DELETE_SELF))
+                {
+                  w->wd = -1;
+                  infy_add (EV_A_ w); /* re-add, no matter what */
+                }
+
+              stat_timer_cb (EV_A_ &w->timer, 0);
+            }
+        }
+    }
+}
+
+static void
+infy_cb (EV_P_ ev_io *w, int revents)
+{
+  char buf [EV_INOTIFY_BUFSIZE];
+  struct inotify_event *ev = (struct inotify_event *)buf;
+  int ofs;
+  int len = read (fs_fd, buf, sizeof (buf));
+
+  for (ofs = 0; ofs < len; ofs += sizeof (struct inotify_event) + ev->len)
+    infy_wd (EV_A_ ev->wd, ev->wd, ev);
 }
 
+void inline_size
+infy_init (EV_P)
+{
+  if (fs_fd != -2)
+    return;
+
+  fs_fd = inotify_init ();
+
+  if (fs_fd >= 0)
+    {
+      ev_io_init (&fs_w, infy_cb, fs_fd, EV_READ);
+      ev_set_priority (&fs_w, EV_MAXPRI);
+      ev_io_start (EV_A_ &fs_w);
+    }
+}
+
+void inline_size
+infy_fork (EV_P)
+{
+  int slot;
+
+  if (fs_fd < 0)
+    return;
+
+  close (fs_fd);
+  fs_fd = inotify_init ();
+
+  for (slot = 0; slot < EV_INOTIFY_HASHSIZE; ++slot)
+    {
+      WL w_ = fs_hash [slot].head;
+      fs_hash [slot].head = 0;
+
+      while (w_)
+        {
+          ev_stat *w = (ev_stat *)w_;
+          w_ = w_->next; /* lets us add this watcher */
+
+          w->wd = -1;
+
+          if (fs_fd >= 0)
+            infy_add (EV_A_ w); /* re-add, no matter what */
+          else
+            ev_timer_start (EV_A_ &w->timer);
+        }
+
+    }
+}
+
+#endif
+
 void
-ev_prepare_stop (struct ev_prepare *w)
+ev_stat_stat (EV_P_ ev_stat *w)
 {
-  ev_clear_pending ((W)w);
-  if (ev_is_active (w))
+  if (lstat (w->path, &w->attr) < 0)
+    w->attr.st_nlink = 0;
+  else if (!w->attr.st_nlink)
+    w->attr.st_nlink = 1;
+}
+
+static void noinline
+stat_timer_cb (EV_P_ ev_timer *w_, int revents)
+{
+  ev_stat *w = (ev_stat *)(((char *)w_) - offsetof (ev_stat, timer));
+
+  /* we copy this here each the time so that */
+  /* prev has the old value when the callback gets invoked */
+  w->prev = w->attr;
+  ev_stat_stat (EV_A_ w);
+
+  /* memcmp doesn't work on netbsd, they.... do stuff to their struct stat */
+  if (
+    w->prev.st_dev      != w->attr.st_dev
+    || w->prev.st_ino   != w->attr.st_ino
+    || w->prev.st_mode  != w->attr.st_mode
+    || w->prev.st_nlink != w->attr.st_nlink
+    || w->prev.st_uid   != w->attr.st_uid
+    || w->prev.st_gid   != w->attr.st_gid
+    || w->prev.st_rdev  != w->attr.st_rdev
+    || w->prev.st_size  != w->attr.st_size
+    || w->prev.st_atime != w->attr.st_atime
+    || w->prev.st_mtime != w->attr.st_mtime
+    || w->prev.st_ctime != w->attr.st_ctime
+  ) {
+      #if EV_USE_INOTIFY
+        infy_del (EV_A_ w);
+        infy_add (EV_A_ w);
+        ev_stat_stat (EV_A_ w); /* avoid race... */
+      #endif
+
+      ev_feed_event (EV_A_ w, EV_STAT);
+    }
+}
+
+void
+ev_stat_start (EV_P_ ev_stat *w)
+{
+  if (expect_false (ev_is_active (w)))
     return;
 
-  prepares [w->active - 1] = prepares [--preparecnt];
-  ev_stop ((W)w);
+  /* since we use memcmp, we need to clear any padding data etc. */
+  memset (&w->prev, 0, sizeof (ev_statdata));
+  memset (&w->attr, 0, sizeof (ev_statdata));
+
+  ev_stat_stat (EV_A_ w);
+
+  if (w->interval < MIN_STAT_INTERVAL)
+    w->interval = w->interval ? MIN_STAT_INTERVAL : DEF_STAT_INTERVAL;
+
+  ev_timer_init (&w->timer, stat_timer_cb, w->interval, w->interval);
+  ev_set_priority (&w->timer, ev_priority (w));
+
+#if EV_USE_INOTIFY
+  infy_init (EV_A);
+
+  if (fs_fd >= 0)
+    infy_add (EV_A_ w);
+  else
+#endif
+    ev_timer_start (EV_A_ &w->timer);
+
+  ev_start (EV_A_ (W)w, 1);
 }
 
 void
-ev_check_start (struct ev_check *w)
+ev_stat_stop (EV_P_ ev_stat *w)
 {
-  if (ev_is_active (w))
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
     return;
 
-  ev_start ((W)w, ++checkcnt);
-  array_needsize (checks, checkmax, checkcnt, );
-  checks [checkcnt - 1] = w;
+#if EV_USE_INOTIFY
+  infy_del (EV_A_ w);
+#endif
+  ev_timer_stop (EV_A_ &w->timer);
+
+  ev_stop (EV_A_ (W)w);
 }
+#endif
 
+#if EV_IDLE_ENABLE
 void
-ev_check_stop (struct ev_check *w)
+ev_idle_start (EV_P_ ev_idle *w)
 {
-  ev_clear_pending ((W)w);
-  if (ev_is_active (w))
+  if (expect_false (ev_is_active (w)))
     return;
 
-  checks [w->active - 1] = checks [--checkcnt];
-  ev_stop ((W)w);
+  pri_adjust (EV_A_ (W)w);
+
+  {
+    int active = ++idlecnt [ABSPRI (w)];
+
+    ++idleall;
+    ev_start (EV_A_ (W)w, active);
+
+    array_needsize (ev_idle *, idles [ABSPRI (w)], idlemax [ABSPRI (w)], active, EMPTY2);
+    idles [ABSPRI (w)][active - 1] = w;
+  }
 }
 
 void
-ev_child_start (struct ev_child *w)
+ev_idle_stop (EV_P_ ev_idle *w)
 {
-  if (ev_is_active (w))
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
     return;
 
-  ev_start ((W)w, 1);
-  wlist_add ((WL *)&childs [w->pid & (PID_HASHSIZE - 1)], (WL)w);
+  {
+    int active = ((W)w)->active;
+
+    idles [ABSPRI (w)][active - 1] = idles [ABSPRI (w)][--idlecnt [ABSPRI (w)]];
+    ((W)idles [ABSPRI (w)][active - 1])->active = active;
+
+    ev_stop (EV_A_ (W)w);
+    --idleall;
+  }
 }
+#endif
 
 void
-ev_child_stop (struct ev_child *w)
+ev_prepare_start (EV_P_ ev_prepare *w)
 {
-  ev_clear_pending ((W)w);
-  if (ev_is_active (w))
+  if (expect_false (ev_is_active (w)))
     return;
 
-  wlist_del ((WL *)&childs [w->pid & (PID_HASHSIZE - 1)], (WL)w);
-  ev_stop ((W)w);
+  ev_start (EV_A_ (W)w, ++preparecnt);
+  array_needsize (ev_prepare *, prepares, preparemax, preparecnt, EMPTY2);
+  prepares [preparecnt - 1] = w;
 }
 
-/*****************************************************************************/
+void
+ev_prepare_stop (EV_P_ ev_prepare *w)
+{
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
+    return;
 
-struct ev_once
+  {
+    int active = ((W)w)->active;
+    prepares [active - 1] = prepares [--preparecnt];
+    ((W)prepares [active - 1])->active = active;
+  }
+
+  ev_stop (EV_A_ (W)w);
+}
+
+void
+ev_check_start (EV_P_ ev_check *w)
 {
-  struct ev_io io;
-  struct ev_timer to;
-  void (*cb)(int revents, void *arg);
-  void *arg;
-};
+  if (expect_false (ev_is_active (w)))
+    return;
 
-static void
-once_cb (struct ev_once *once, int revents)
+  ev_start (EV_A_ (W)w, ++checkcnt);
+  array_needsize (ev_check *, checks, checkmax, checkcnt, EMPTY2);
+  checks [checkcnt - 1] = w;
+}
+
+void
+ev_check_stop (EV_P_ ev_check *w)
 {
-  void (*cb)(int revents, void *arg) = once->cb;
-  void *arg = once->arg;
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
+    return;
 
-  ev_io_stop (&once->io);
-  ev_timer_stop (&once->to);
-  free (once);
+  {
+    int active = ((W)w)->active;
+    checks [active - 1] = checks [--checkcnt];
+    ((W)checks [active - 1])->active = active;
+  }
 
-  cb (revents, arg);
+  ev_stop (EV_A_ (W)w);
+}
+
+#if EV_EMBED_ENABLE
+void noinline
+ev_embed_sweep (EV_P_ ev_embed *w)
+{
+  ev_loop (w->other, EVLOOP_NONBLOCK);
 }
 
 static void
-once_cb_io (struct ev_io *w, int revents)
+embed_io_cb (EV_P_ ev_io *io, int revents)
 {
-  once_cb ((struct ev_once *)(((char *)w) - offsetof (struct ev_once, io)), revents);
+  ev_embed *w = (ev_embed *)(((char *)io) - offsetof (ev_embed, io));
+
+  if (ev_cb (w))
+    ev_feed_event (EV_A_ (W)w, EV_EMBED);
+  else
+    ev_embed_sweep (loop, w);
 }
 
 static void
-once_cb_to (struct ev_timer *w, int revents)
+embed_prepare_cb (EV_P_ ev_prepare *prepare, int revents)
 {
-  once_cb ((struct ev_once *)(((char *)w) - offsetof (struct ev_once, to)), revents);
+  ev_embed *w = (ev_embed *)(((char *)prepare) - offsetof (ev_embed, prepare));
+
+  fd_reify (w->other);
 }
 
 void
-ev_once (int fd, int events, ev_tstamp timeout, void (*cb)(int revents, void *arg), void *arg)
+ev_embed_start (EV_P_ ev_embed *w)
 {
-  struct ev_once *once = malloc (sizeof (struct ev_once));
+  if (expect_false (ev_is_active (w)))
+    return;
 
-  if (!once)
-    cb (EV_ERROR | EV_READ | EV_WRITE | EV_TIMEOUT, arg);
-  else
-    {
-      once->cb  = cb;
-      once->arg = arg;
+  {
+    struct ev_loop *loop = w->other;
+    assert (("loop to be embedded is not embeddable", backend & ev_embeddable_backends ()));
+    ev_io_init (&w->io, embed_io_cb, backend_fd, EV_READ);
+  }
 
-      ev_watcher_init (&once->io, once_cb_io);
-      if (fd >= 0)
-        {
-          ev_io_set (&once->io, fd, events);
-          ev_io_start (&once->io);
-        }
+  ev_set_priority (&w->io, ev_priority (w));
+  ev_io_start (EV_A_ &w->io);
 
-      ev_watcher_init (&once->to, once_cb_to);
-      if (timeout >= 0.)
-        {
-          ev_timer_set (&once->to, timeout, 0.);
-          ev_timer_start (&once->to);
-        }
-    }
+  ev_prepare_init (&w->prepare, embed_prepare_cb);
+  ev_set_priority (&w->prepare, EV_MINPRI);
+  ev_prepare_start (EV_A_ &w->prepare);
+
+  ev_start (EV_A_ (W)w, 1);
 }
 
-/*****************************************************************************/
+void
+ev_embed_stop (EV_P_ ev_embed *w)
+{
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
+    return;
 
-#if 0
+  ev_io_stop (EV_A_ &w->io);
+  ev_prepare_stop (EV_A_ &w->prepare);
 
-struct ev_io wio;
+  ev_stop (EV_A_ (W)w);
+}
+#endif
 
-static void
-sin_cb (struct ev_io *w, int revents)
+#if EV_FORK_ENABLE
+void
+ev_fork_start (EV_P_ ev_fork *w)
 {
-  fprintf (stderr, "sin %d, revents %d\n", w->fd, revents);
+  if (expect_false (ev_is_active (w)))
+    return;
+
+  ev_start (EV_A_ (W)w, ++forkcnt);
+  array_needsize (ev_fork *, forks, forkmax, forkcnt, EMPTY2);
+  forks [forkcnt - 1] = w;
 }
 
-static void
-ocb (struct ev_timer *w, int revents)
+void
+ev_fork_stop (EV_P_ ev_fork *w)
 {
-  //fprintf (stderr, "timer %f,%f (%x) (%f) d%p\n", w->at, w->repeat, revents, w->at - ev_time (), w->data);
-  ev_timer_stop (w);
-  ev_timer_start (w);
+  clear_pending (EV_A_ (W)w);
+  if (expect_false (!ev_is_active (w)))
+    return;
+
+  {
+    int active = ((W)w)->active;
+    forks [active - 1] = forks [--forkcnt];
+    ((W)forks [active - 1])->active = active;
+  }
+
+  ev_stop (EV_A_ (W)w);
 }
+#endif
 
-static void
-scb (struct ev_signal *w, int revents)
+/*****************************************************************************/
+
+struct ev_once
 {
-  fprintf (stderr, "signal %x,%d\n", revents, w->signum);
-  ev_io_stop (&wio);
-  ev_io_start (&wio);
-}
+  ev_io io;
+  ev_timer to;
+  void (*cb)(int revents, void *arg);
+  void *arg;
+};
 
 static void
-gcb (struct ev_signal *w, int revents)
+once_cb (EV_P_ struct ev_once *once, int revents)
 {
-  fprintf (stderr, "generic %x\n", revents);
+  void (*cb)(int revents, void *arg) = once->cb;
+  void *arg = once->arg;
 
+  ev_io_stop (EV_A_ &once->io);
+  ev_timer_stop (EV_A_ &once->to);
+  ev_free (once);
+
+  cb (revents, arg);
 }
 
-int main (void)
+static void
+once_cb_io (EV_P_ ev_io *w, int revents)
 {
-  ev_init (0);
+  once_cb (EV_A_ (struct ev_once *)(((char *)w) - offsetof (struct ev_once, io)), revents);
+}
 
-  ev_io_init (&wio, sin_cb, 0, EV_READ);
-  ev_io_start (&wio);
+static void
+once_cb_to (EV_P_ ev_timer *w, int revents)
+{
+  once_cb (EV_A_ (struct ev_once *)(((char *)w) - offsetof (struct ev_once, to)), revents);
+}
 
-  struct ev_timer t[10000];
+void
+ev_once (EV_P_ int fd, int events, ev_tstamp timeout, void (*cb)(int revents, void *arg), void *arg)
+{
+  struct ev_once *once = (struct ev_once *)ev_malloc (sizeof (struct ev_once));
 
-#if 0
-  int i;
-  for (i = 0; i < 10000; ++i)
+  if (expect_false (!once))
     {
-      struct ev_timer *w = t + i;
-      ev_watcher_init (w, ocb, i);
-      ev_timer_init_abs (w, ocb, drand48 (), 0.99775533);
-      ev_timer_start (w);
-      if (drand48 () < 0.5)
-        ev_timer_stop (w);
+      cb (EV_ERROR | EV_READ | EV_WRITE | EV_TIMEOUT, arg);
+      return;
     }
-#endif
-
-  struct ev_timer t1;
-  ev_timer_init (&t1, ocb, 5, 10);
-  ev_timer_start (&t1);
-
-  struct ev_signal sig;
-  ev_signal_init (&sig, scb, SIGQUIT);
-  ev_signal_start (&sig);
 
-  struct ev_check cw;
-  ev_check_init (&cw, gcb);
-  ev_check_start (&cw);
+  once->cb  = cb;
+  once->arg = arg;
 
-  struct ev_idle iw;
-  ev_idle_init (&iw, gcb);
-  ev_idle_start (&iw);
-
-  ev_loop (0);
+  ev_init (&once->io, once_cb_io);
+  if (fd >= 0)
+    {
+      ev_io_set (&once->io, fd, events);
+      ev_io_start (EV_A_ &once->io);
+    }
 
-  return 0;
+  ev_init (&once->to, once_cb_to);
+  if (timeout >= 0.)
+    {
+      ev_timer_set (&once->to, timeout, 0.);
+      ev_timer_start (EV_A_ &once->to);
+    }
 }
 
+#if EV_MULTIPLICITY
+  #include "ev_wrap.h"
 #endif
 
-
-
+#ifdef __cplusplus
+}
+#endif