#ifdef _WIN32
-//min y max entran en conflicto con la windows.h, son rebautizadas en Windows
+// min y max entran en conflicto con la windows.h, son rebautizadas en Windows
#define min _cpp_min
#define max _cpp_max
#endif
#include <deque>
#include <utility>
#include <algorithm>
-#include <iterator>
+#include <iomanip>
+#include <stdint.h>
-//XXX Pensado para andar con unsigned's (si anda con otra cosa es casualidad =)
+enum sign_type { positive, negative };
+
+
+/* sizeof(E) tiene que ser 2*sizeof(N); y son los tipos nativos con los cuales
+ * se haran las operaciones mas basicas. */
+
+template < typename N, typename E >
+struct number;
+
+template < typename N, typename E >
+std::ostream& operator<< (std::ostream& os, const number< N, E >& n);
template < typename N = uint32_t, typename E = uint64_t >
struct number
// Tipos
typedef N native_type;
typedef E extended_type;
- enum sign_type { positive, negative };
typedef typename std::deque< native_type > chunk_type;
typedef typename chunk_type::size_type size_type;
typedef typename chunk_type::iterator iterator;
typedef typename chunk_type::reverse_iterator reverse_iterator;
typedef typename chunk_type::const_reverse_iterator const_reverse_iterator;
- // Constructores (después de construído, el chunk siempre tiene al menos
- // un elemento).
+ // Constructores (después de construído, el chunk siempre tiene al
+ // menos un elemento).
// Constructor default (1 'átomo con valor 0)
number(): chunk(1, 0) {}
+
// Constructor a partir de buffer (de 'átomos') y tamaño
// Copia cada elemento del buffer como un 'átomo' del chunk
// (el átomo menos significativo es el chunk[0] == buf[0])
number(native_type* buf, size_type len, sign_type sign = positive):
chunk(buf, buf + len), sign(sign)
- { fix_empty(); }
- // Constructor a partir de un buffer (de 'átomos') terminado en 0
- // FIXME (en realidad está 'roto' este contructor porque no puedo
- // inicializar números con un átomo == 0 en el medio)
- number(native_type* buf, sign_type sign = positive): sign(sign)
- { while (*buf) chunk.push_back(*(buf++)); fix_empty(); }
- // Constructor a partir de un 'átomo' (lo asigna como único elemento del
- // chunk)
+ {
+ fix_empty();
+ }
+
+ // Constructor a partir de un 'átomo' (lo asigna como único elemento
+ // del chunk). Copia una vez N en el vector.
number(native_type n, sign_type sign = positive):
- chunk(1, n), sign(sign) {} // copia una vez n en el vector
+ chunk(1, n), sign(sign) {}
+
// TODO constructor a partir de string.
// Operadores
- number& operator++ () { carry(0); return *this; }
+ number& operator++ ()
+ {
+ carry(0);
+ return *this;
+ }
+
number& operator+= (const number& n);
number& operator*= (const number& n);
number& operator<<= (const size_type n);
// Devuelve referencia a 'átomo' i del chunk (no debería ser necesario
// si la multiplicación es un método de este objeto).
- native_type& operator[] (size_type i) { return chunk[i]; }
+ native_type& operator[] (size_type i)
+ {
+ return chunk[i];
+ }
// Iteradores (no deberían ser necesarios)
iterator begin() { return chunk.begin(); }
const_reverse_iterator rbegin() const { return chunk.rbegin(); }
const_reverse_iterator rend() const { return chunk.rend(); }
- private:
+ // Friends
+ template < typename NN, typename EE >
+ friend std::ostream& operator<< (std::ostream& os, const number< NN, EE>& n);
+
// Atributos
+ //private:
chunk_type chunk;
sign_type sign;
if (chunk.size() > i)
{
++chunk[i];
- if (!chunk[i]) carry(i+1); // Overflow
+ if (chunk[i] == 0)
+ carry(i+1); // Overflow
}
- else chunk.push_back(1);
+ else
+ chunk.push_back(1);
}
};
// +-----+-----+------+
// | | | | <--- chunk de n
// +-----+-----+------+
- //
+ //
// |------------------|
// Esto se procesa en este for
for (i = ini; i < fin; ++i)
{
chunk[i] += n.chunk[i] + c;
- if (chunk[i] || (!n.chunk[i] && !c)) c = 0; // OK
- else c = 1; // Overflow
+ if ((chunk[i] < n.chunk[i]) || \
+ ( (n.chunk[i] == 0) && c && (chunk[i] == 0) ))
+ c = 1; // Overflow
+ else
+ c = 0; // OK
}
+
// si mi chunk es más grande que el del otro, sólo me queda
// propagar el carry
if (chunk.size() >= n.chunk.size())
{
- if (c) carry(fin); // Propago carry
+ if (c)
+ carry(fin); // Propago carry
return *this;
}
+
// Hay más
// +-----+-----+------+
// | | | | <--- mío
// +-----+-----+------+------+
// | | | | | <--- chunk de n
// +-----+-----+------+------+
- //
+ //
// |------|
// Esto se procesa en este for
// (suma los chunks de n propagando algún carry si lo había)
for (i = ini; i < fin; ++i)
{
chunk.push_back(n.chunk[i] + c); // Agrego nuevo átomo
- if (chunk[i] || !c) c = 0; // OK
- else c = 1; // Overflow
+ if (chunk[i] != 0 || !c)
+ c = 0; // OK
+ else
+ c = 1; // Overflow
}
+
// Si me queda algún carry colgado, hay que agregar un "átomo"
// más al chunk.
- if (c) chunk.push_back(1); // Último carry
+ if (c)
+ chunk.push_back(1); // Último carry
+
return *this;
}
std::ostream& operator<< (std::ostream& os, const number< N, E >& n)
{
// FIXME sacar una salida bonita en ASCII =)
- std::copy(n.begin(), n.end(), std::ostream_iterator< N >(os, " "));
+ for (typename number< N, E >::const_iterator i = n.chunk.begin();
+ i != n.chunk.end(); ++i)
+ os << std::setfill('0') << std::setw(sizeof(N) * 2) << std::hex
+ << *i << " ";
return os;
}
template < typename N, typename E >
number< N, E >& number< N, E >::operator*= (const number< N, E >& n)
{
- number < N, E > r_op = n;
- normalize_length(n);
- n.normalize_length(*this);
- *this = divide_n_conquer(*this, n);
+ //number < N, E > r_op = n;
+ //normalize_length(n);
+ //n.normalize_length(*this);
+ *this = naif(*this, n);
return *this;
}
template < typename N, typename E >
number< N, E > operator* (const number< N, E >& n1, const number< N, E >& n2)
{
- number< N, E > tmp = n1;
- tmp *= n2;
- return tmp;
+ return naif(n1, n2);
}
template < typename N, typename E >
number< N, E >& number< N, E >::normalize_length(const number< N, E >& n)
{
- //si son de distinto tamaño tengo que agregar ceros a la izquierda al menor para división y conquista
+ // si son de distinto tamaño tengo que agregar ceros a la izquierda al
+ // menor para división y conquista
while (chunk.size() < n.chunk.size())
{
chunk.push_back(0);
}
- //si no tiene cantidad par de números le agrego un atomic_type 0 a la izquierda para no tener que contemplar
- //splits de chunks impares
+ // si no tiene cantidad par de números le agrego un atomic_type 0 a la
+ // izquierda para no tener que contemplar splits de chunks impares
if ((chunk.size() % 2) != 0)
{
chunk.push_back(0);
std::pair< num_type, num_type > par;
// la primera mitad va al pedazo inferior
- for (i = 0; i < halves_size; i++)
+ par.first.chunk[0] = chunk[0];
+ for (i = 1; i < halves_size; i++)
{
par.first.chunk.push_back(chunk[i]);
}
- // la segunda mitad (si full_size es impar es 1 más que la primera mitad) va al pedazo superior
- for ( ; i < full_size; i++)
+ // la segunda mitad (si full_size es impar es 1 más que la primera
+ // mitad) va al pedazo superior
+ par.second.chunk[0] = chunk[i];
+ for (i++ ; i < full_size; i++)
{
par.second.chunk.push_back(chunk[i]);
}
// es el algoritmo de división y conquista, que se llama recursivamente
template < typename N, typename E >
-number < N, E > divide_n_conquer(number< N, E > u, number< N, E > v)
+number < N, E > karatsuba(const number< N, E > &u, const number< N, E > &v)
{
typedef number< N, E > num_type;
- //tomo el chunk size de u (el de v DEBE ser el mismo)
+
+ // tomo el chunk size de u (el de v DEBE ser el mismo)
typename num_type::size_type chunk_size = u.chunk.size();
-
+
if (chunk_size == 1)
{
- //condición de corte. Ver que por más que tenga 1 único elemento puede "rebalsar" la capacidad
- //del atomic_type, como ser multiplicando 0xff * 0xff usando bytes!!!
+ // condición de corte. Ver que por más que tenga 1 único
+ // elemento puede "rebalsar" la capacidad del atomic_type,
+ // como ser multiplicando 0xff * 0xff usando bytes!!!
return u.chunk[0] * v.chunk[0];
}
-
+
std::pair< num_type, num_type > u12 = u.split();
std::pair< num_type, num_type > v12 = v.split();
- // Los nombres M, D y H los puso Rosita en clase, cambiar si se les ocurren algunos mejores!
+ // Los nombres M, D y H los puso Rosita en clase, cambiar si se les
+ // ocurren algunos mejores!
// m = u1*v1
// d = u2*v2
// h = (u1+v1)*(u2+v2) = u1*u2+u1*v2+u2*v1+u2*v2
- num_type m = divide_n_conquer(u12.first, v12.first);
- num_type d = divide_n_conquer(u12.second, v12.second);
- num_type h = divide_n_conquer(u12.first + v12.first, u12.second + v12.second);
+ num_type m = karastuba(u12.first, v12.first);
+ num_type d = karastuba(u12.second, v12.second);
+ num_type h = karastuba(u12.first + v12.first,
+ u12.second + v12.second);
// H-D-M = u1*u2+u1*v2+u2*v1+u2*v2 - u2*v2 - u1*v1 = u1*v2+u2*v1
// u1*v1 << base^N + u1*v2+u2*v1 << base^N/2 + u2*v2
return (m << chunk_size) + ((h - d - m) << chunk_size / 2) + h;
-
+
}
+
+/* Algoritmo "naif" (por no decir "cabeza" o "bruto") de multiplicacion. */
+template < typename N, typename E >
+number < N, E > naif(const number< N, E > &u, const number< N, E > &v)
+{
+ typedef number< N, E > num_type;
+
+ // tomo el chunk size de u (el de v DEBE ser el mismo)
+ typename num_type::size_type chunk_size = u.chunk.size();
+
+ sign_type sign;
+
+ if ( (u.sign == positive && v.sign == positive) ||
+ (u.sign == negative && v.sign == negative) ) {
+ sign = positive;
+ } else {
+ sign = negative;
+ }
+
+ //printf("naif %d %d\n", u.chunk.size(), v.chunk.size() );
+
+ if (chunk_size == 1)
+ {
+ /* Si llegamos a multiplicar dos de tamaño 1, lo que hacemos
+ * es usar la multiplicacion nativa del tipo N, guardando el
+ * resultado en el tipo E (que sabemos es del doble de tamaño
+ * de N, ni mas ni menos).
+ * Luego, armamos un objeto number usando al resultado como
+ * buffer. Si, es feo.
+ */
+ E tmp;
+ tmp = static_cast< E >(u.chunk[0]) * static_cast< E >(v.chunk[0]);
+ num_type tnum = num_type(reinterpret_cast< N* >(&tmp), 2, sign);
+ //std::cout << "T:" << tnum << " " << tmp << "\n";
+ //printf("1: %lu %lu %llu\n", u.chunk[0], v.chunk[0], tmp);
+ return tnum;
+ }
+
+ std::pair< num_type, num_type > u12 = u.split();
+ std::pair< num_type, num_type > v12 = v.split();
+
+ //std::cout << "u:" << u12.first << " - " << u12.second << "\n";
+ //std::cout << "v:" << v12.first << " - " << v12.second << "\n";
+
+ /* m11 = u1*v1
+ * m12 = u1*v2
+ * m21 = u2*v1
+ * m22 = u2*v2
+ */
+ num_type m11 = naif(u12.first, v12.first);
+ num_type m12 = naif(u12.first, v12.second);
+ num_type m21 = naif(u12.second, v12.first);
+ num_type m22 = naif(u12.second, v12.second);
+
+ /*
+ printf("csize: %d\n", chunk_size);
+ std::cout << "11 " << m11 << "\n";
+ std::cout << "12 " << m12 << "\n";
+ std::cout << "21 " << m21 << "\n";
+ std::cout << "22 " << m22 << "\n";
+ */
+
+ /* u*v = (u1*v1) * 2^n + (u1*v2 + u2*v1) * 2^(n/2) + u2*v2
+ * PERO! Como los numeros estan "al reves" nos queda:
+ * = m22 * 2^n + (m12 + m21) * 2^(n/2) + m11
+ */
+ num_type res;
+ res = m22 << chunk_size;
+ res = res + ((m12 + m21) << (chunk_size / 2));
+ res = res + m11;
+ res.sign = sign;
+ /*
+ std::cout << "r: " << res << "\n";
+ std::cout << "\n";
+ */
+ return res;
+}
+
+
+