Bugfix de cast a la C++.

[z.facultad/75.29/dale.git] / src / number.h
diff --git a/src/number.h b/src/number.h

index b5e433f3b6a53bf60138483991a66603f1b15965..99eec8c22534d6815c8177fda66e77a58d97a4e9 100644 (file)
--- a/src/number.h
+++ b/src/number.h
@@ -1,5 +1,5 @@
  #ifdef _WIN32
-//min y max entran en conflicto con la windows.h, son rebautizadas en Windows
+// min y max entran en conflicto con la windows.h, son rebautizadas en Windows
  #define min _cpp_min
  #define max _cpp_max
  #endif
@@ -7,9 +7,20 @@
  #include <deque>
  #include <utility>
  #include <algorithm>
-#include <iterator>
+#include <iomanip>
+#include <stdint.h>
  
-//XXX Pensado para andar con unsigned's (si anda con otra cosa es casualidad =)
+enum sign_type { positive, negative };
+
+
+/* sizeof(E) tiene que ser 2*sizeof(N); y son los tipos nativos con los cuales
+ * se haran las operaciones mas basicas. */
+
+template < typename N, typename E >
+struct number;
+
+template < typename N, typename E >
+std::ostream& operator<< (std::ostream& os, const number< N, E >& n);
  
  template < typename N = uint32_t, typename E = uint64_t >
  struct number
@@ -18,7 +29,6 @@ struct number
         // Tipos
         typedef N native_type;
         typedef E extended_type;
-       enum sign_type { positive, negative };
         typedef typename std::deque< native_type > chunk_type;
         typedef typename chunk_type::size_type size_type;
         typedef typename chunk_type::iterator iterator;
@@ -26,36 +36,44 @@ struct number
         typedef typename chunk_type::reverse_iterator reverse_iterator;
         typedef typename chunk_type::const_reverse_iterator const_reverse_iterator;
  
-       // Constructores (después de construído, el chunk siempre tiene al menos
-       // un elemento).
+       // Constructores (después de construído, el chunk siempre tiene al
+       // menos un elemento).
         // Constructor default (1 'átomo con valor 0)
         number(): chunk(1, 0) {}
+
         // Constructor a partir de buffer (de 'átomos') y tamaño
         // Copia cada elemento del buffer como un 'átomo' del chunk
         // (el átomo menos significativo es el chunk[0] == buf[0])
         number(native_type* buf, size_type len, sign_type sign = positive):
                 chunk(buf, buf + len), sign(sign)
-               { fix_empty(); }
-       // Constructor a partir de un buffer (de 'átomos') terminado en 0
-       // FIXME (en realidad está 'roto' este contructor porque no puedo
-       // inicializar números con un átomo == 0 en el medio)
-       number(native_type* buf, sign_type sign = positive): sign(sign)
-               { while (*buf) chunk.push_back(*(buf++)); fix_empty(); }
-       // Constructor a partir de un 'átomo' (lo asigna como único elemento del
-       // chunk)
+       {
+               fix_empty();
+       }
+
+       // Constructor a partir de un 'átomo' (lo asigna como único elemento
+       // del chunk). Copia una vez N en el vector.
         number(native_type n, sign_type sign = positive):
-               chunk(1, n), sign(sign) {} // copia una vez n en el vector
+               chunk(1, n), sign(sign) {}
+
         // TODO constructor a partir de string.
  
         // Operadores
-       number& operator++ () { carry(0); return *this; }
+       number& operator++ ()
+       {
+               carry(0);
+               return *this;
+       }
+
         number& operator+= (const number& n);
         number& operator*= (const number& n);
         number& operator<<= (const size_type n);
  
         // Devuelve referencia a 'átomo' i del chunk (no debería ser necesario
         // si la multiplicación es un método de este objeto).
-       native_type& operator[] (size_type i) { return chunk[i]; }
+       native_type& operator[] (size_type i)
+       {
+               return chunk[i];
+       }
  
         // Iteradores (no deberían ser necesarios)
         iterator begin() { return chunk.begin(); }
@@ -67,8 +85,12 @@ struct number
         const_reverse_iterator rbegin() const { return chunk.rbegin(); }
         const_reverse_iterator rend() const { return chunk.rend(); }
  
-       private:
+       // Friends
+       template < typename NN, typename EE >
+       friend std::ostream& operator<< (std::ostream& os, const number< NN, EE>& n);
+
         // Atributos
+       //private:
         chunk_type chunk;
         sign_type sign;
  
@@ -89,9 +111,11 @@ struct number
                 if (chunk.size() > i)
                 {
                         ++chunk[i];
-                       if (!chunk[i]) carry(i+1); // Overflow
+                       if (chunk[i] == 0)
+                               carry(i+1); // Overflow
                 }
-               else chunk.push_back(1);
+               else
+                       chunk.push_back(1);
         }
  
  };
@@ -111,22 +135,28 @@ number< N, E >& number< N, E >::operator+= (const number< N, E >& n)
         // +-----+-----+------+
         // |     |     |      |        <--- chunk de n
         // +-----+-----+------+
-       // 
+       //
         // |------------------|
         // Esto se procesa en este for
         for (i = ini; i < fin; ++i)
         {
                 chunk[i] += n.chunk[i] + c;
-               if (chunk[i] || (!n.chunk[i] && !c)) c = 0; // OK
-               else                                 c = 1; // Overflow
+               if ((chunk[i] < n.chunk[i]) || \
+                               ( (n.chunk[i] == 0) && c && (chunk[i] == 0) ))
+                       c = 1; // Overflow
+               else
+                       c = 0; // OK
         }
+
         // si mi chunk es más grande que el del otro, sólo me queda
         // propagar el carry
         if (chunk.size() >= n.chunk.size())
         {
-               if (c) carry(fin); // Propago carry
+               if (c)
+                       carry(fin); // Propago carry
                 return *this;
         }
+
         // Hay más
         // +-----+-----+------+
         // |     |     |      |         <--- mío
@@ -134,7 +164,7 @@ number< N, E >& number< N, E >::operator+= (const number< N, E >& n)
         // +-----+-----+------+------+
         // |     |     |      |      |  <--- chunk de n
         // +-----+-----+------+------+
-       // 
+       //
         //                    |------|
         //            Esto se procesa en este for
         // (suma los chunks de n propagando algún carry si lo había)
@@ -143,12 +173,17 @@ number< N, E >& number< N, E >::operator+= (const number< N, E >& n)
         for (i = ini; i < fin; ++i)
         {
                 chunk.push_back(n.chunk[i] + c); // Agrego nuevo átomo
-               if (chunk[i] || !c) c = 0; // OK
-               else                c = 1; // Overflow
+               if (chunk[i] != 0 || !c)
+                       c = 0; // OK
+               else
+                       c = 1; // Overflow
         }
+
         // Si me queda algún carry colgado, hay que agregar un "átomo"
         // más al chunk.
-       if (c) chunk.push_back(1); // Último carry
+       if (c)
+               chunk.push_back(1); // Último carry
+
         return *this;
  }
  
@@ -184,39 +219,41 @@ template < typename N, typename E >
  std::ostream& operator<< (std::ostream& os, const number< N, E >& n)
  {
         // FIXME sacar una salida bonita en ASCII =)
-       std::copy(n.begin(), n.end(), std::ostream_iterator< N >(os, " "));
+       for (typename number< N, E >::const_iterator i = n.chunk.begin();
+                       i != n.chunk.end(); ++i)
+               os << std::setfill('0') << std::setw(sizeof(N) * 2) << std::hex
+                       << *i << " ";
         return os;
  }
  
  template < typename N, typename E >
  number< N, E >& number< N, E >::operator*= (const number< N, E >& n)
  {
-       number < N, E > r_op = n;
-       normalize_length(n);
-       n.normalize_length(*this);
-       *this = divide_n_conquer(*this, n);
+       //number < N, E > r_op = n;
+       //normalize_length(n);
+       //n.normalize_length(*this);
+       *this = naif(*this, n);
         return *this;
  }
  
  template < typename N, typename E >
  number< N, E > operator* (const number< N, E >& n1, const number< N, E >& n2)
  {
-       number< N, E > tmp = n1;
-       tmp *= n2;
-       return tmp;
+       return naif(n1, n2);
  }
  
  template < typename N, typename E >
  number< N, E >& number< N, E >::normalize_length(const number< N, E >& n)
  {
-       //si son de distinto tamaño tengo que agregar ceros a la izquierda al menor para división y conquista
+       // si son de distinto tamaño tengo que agregar ceros a la izquierda al
+       // menor para división y conquista
         while (chunk.size() < n.chunk.size())
         {
                 chunk.push_back(0);
         }
  
-       //si no tiene cantidad par de números le agrego un atomic_type 0 a la izquierda para no tener que contemplar
-       //splits de chunks impares
+       // si no tiene cantidad par de números le agrego un atomic_type 0 a la
+       // izquierda para no tener que contemplar splits de chunks impares
         if ((chunk.size() % 2) != 0)
         {
                 chunk.push_back(0);
@@ -235,13 +272,16 @@ std::pair< number< N, E >, number< N, E > > number< N, E >::split() const
         std::pair< num_type, num_type > par;
  
         // la primera mitad va al pedazo inferior
-       for (i = 0; i < halves_size; i++)
+       par.first.chunk[0] = chunk[0];
+       for (i = 1; i < halves_size; i++)
         {
                 par.first.chunk.push_back(chunk[i]);
         }
  
-       // la segunda mitad (si full_size es impar es 1 más que la primera mitad) va al pedazo superior
-       for ( ; i < full_size; i++)
+       // la segunda mitad (si full_size es impar es 1 más que la primera
+       // mitad) va al pedazo superior
+       par.second.chunk[0] = chunk[i];
+       for (i++ ; i < full_size; i++)
         {
                 par.second.chunk.push_back(chunk[i]);
         }
@@ -250,33 +290,117 @@ std::pair< number< N, E >, number< N, E > > number< N, E >::split() const
  
  // es el algoritmo de división y conquista, que se llama recursivamente
  template < typename N, typename E >
-number < N, E > divide_n_conquer(number< N, E > u, number< N, E > v)
+number < N, E > karatsuba(const number< N, E > &u, const number< N, E > &v)
  {
         typedef number< N, E > num_type;
-       //tomo el chunk size de u (el de v DEBE ser el mismo)
+
+       // tomo el chunk size de u (el de v DEBE ser el mismo)
         typename num_type::size_type chunk_size = u.chunk.size();
-       
+
         if (chunk_size == 1)
         {
-               //condición de corte. Ver que por más que tenga 1 único elemento puede "rebalsar" la capacidad
-               //del atomic_type, como ser multiplicando 0xff * 0xff usando bytes!!!
+               // condición de corte. Ver que por más que tenga 1 único
+               // elemento puede "rebalsar" la capacidad del atomic_type,
+               // como ser multiplicando 0xff * 0xff usando bytes!!!
                 return u.chunk[0] * v.chunk[0];
         }
-       
+
         std::pair< num_type, num_type > u12 = u.split();
         std::pair< num_type, num_type > v12 = v.split();
  
-       // Los nombres M, D y H los puso Rosita en clase, cambiar si se les ocurren algunos mejores!
+       // Los nombres M, D y H los puso Rosita en clase, cambiar si se les
+       // ocurren algunos mejores!
         // m = u1*v1
         // d = u2*v2
         // h = (u1+v1)*(u2+v2) = u1*u2+u1*v2+u2*v1+u2*v2
-       num_type m = divide_n_conquer(u12.first, v12.first);
-       num_type d = divide_n_conquer(u12.second, v12.second);
-       num_type h = divide_n_conquer(u12.first + v12.first, u12.second + v12.second);
+       num_type m = karastuba(u12.first, v12.first);
+       num_type d = karastuba(u12.second, v12.second);
+       num_type h = karastuba(u12.first + v12.first,
+                       u12.second + v12.second);
  
         // H-D-M = u1*u2+u1*v2+u2*v1+u2*v2 - u2*v2 - u1*v1 = u1*v2+u2*v1
         // u1*v1 << base^N + u1*v2+u2*v1 << base^N/2 + u2*v2
         return (m << chunk_size) + ((h - d - m) << chunk_size / 2) + h;
-       
+
  }
  
+
+/* Algoritmo "naif" (por no decir "cabeza" o "bruto") de multiplicacion. */
+template < typename N, typename E >
+number < N, E > naif(const number< N, E > &u, const number< N, E > &v)
+{
+       typedef number< N, E > num_type;
+
+       // tomo el chunk size de u (el de v DEBE ser el mismo)
+       typename num_type::size_type chunk_size = u.chunk.size();
+
+       sign_type sign;
+
+       if ( (u.sign == positive && v.sign == positive) ||
+                       (u.sign == negative && v.sign == negative) ) {
+               sign = positive;
+       } else {
+               sign = negative;
+       }
+
+       //printf("naif %d %d\n", u.chunk.size(), v.chunk.size() );
+
+       if (chunk_size == 1)
+       {
+               /* Si llegamos a multiplicar dos de tamaño 1, lo que hacemos
+                * es usar la multiplicacion nativa del tipo N, guardando el
+                * resultado en el tipo E (que sabemos es del doble de tamaño
+                * de N, ni mas ni menos).
+                * Luego, armamos un objeto number usando al resultado como
+                * buffer. Si, es feo.
+                */
+               E tmp;
+               tmp = static_cast< E >(u.chunk[0]) * static_cast< E >(v.chunk[0]);
+               num_type tnum = num_type(reinterpret_cast< N* >(&tmp), 2, sign);
+               //std::cout << "T:" << tnum << " " << tmp << "\n";
+               //printf("1: %lu %lu %llu\n", u.chunk[0], v.chunk[0], tmp);
+               return tnum;
+       }
+
+       std::pair< num_type, num_type > u12 = u.split();
+       std::pair< num_type, num_type > v12 = v.split();
+
+       //std::cout << "u:" << u12.first << " - " << u12.second << "\n";
+       //std::cout << "v:" << v12.first << " - " << v12.second << "\n";
+
+       /* m11 = u1*v1
+        * m12 = u1*v2
+        * m21 = u2*v1
+        * m22 = u2*v2
+        */
+       num_type m11 = naif(u12.first, v12.first);
+       num_type m12 = naif(u12.first, v12.second);
+       num_type m21 = naif(u12.second, v12.first);
+       num_type m22 = naif(u12.second, v12.second);
+
+       /*
+       printf("csize: %d\n", chunk_size);
+       std::cout << "11 " << m11 << "\n";
+       std::cout << "12 " << m12 << "\n";
+       std::cout << "21 " << m21 << "\n";
+       std::cout << "22 " << m22 << "\n";
+       */
+
+       /* u*v = (u1*v1) * 2^n + (u1*v2 + u2*v1) * 2^(n/2) + u2*v2
+        * PERO! Como los numeros estan "al reves" nos queda:
+        *     = m22 * 2^n + (m12 + m21) * 2^(n/2) + m11
+        */
+       num_type res;
+       res = m22 << chunk_size;
+       res = res + ((m12 + m21) << (chunk_size / 2));
+       res = res + m11;
+       res.sign = sign;
+       /*
+       std::cout << "r: " << res << "\n";
+       std::cout << "\n";
+       */
+       return res;
+}
+
+
+