#include "indice_b.h"
-
-#define FILENAME "b.idx"
-#define BLOCK_SIZE 512
+#include "common.h"
+#include "emufs.h"
+#include "form.h"
/* Cantidad de claves por nodo */
-#define CANT_HIJOS ((BLOCK_SIZE-sizeof(B_NodoHeader))/sizeof(B_NodoEntry))
-#define CANT_NODOS (CANT_HIJOS+1)
-#define MIN_HIJOS (CANT_HIJOS/2)
+#define CANT_HIJOS(x) ((x->tam_bloque-sizeof(B_NodoHeader))/sizeof(B_NodoEntry))
+#define CANT_NODOS(x) (CANT_HIJOS(x)+1)
+#define MIN_HIJOS(x) (CANT_HIJOS(x)/2)
/* Auxiliares */
-static void b_grabar_nodo(int id, char *data);
-static int b_ultimo_id();
-static char *b_leer_nodo(int id);
-static char *b_crear_nodo();
-static void b_leer_header(char *src, B_NodoHeader *header);
+/** Graba el nodo en el archivo */
+static void b_grabar_nodo(INDICE *idx, int id, char *data);
+/** Da el ID del proximo nodo a poder ser utilizado */
+static int b_ultimo_id(INDICE *idx);
+/** Crea un nodo en el archivo y lo retorna. En i se pone el ID asignado */
+static char *b_crear_nodo(INDICE *idx, int *i);
+/** Actualiza el header de un nodo desde header */
static void b_actualizar_header(char *src, B_NodoHeader *header);
-static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header);
-static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo, int hijo1, int hijo2);
-const int b_elegir_izquierdo(int a, int b);
+/** Inserta una clave en el nodo de manera iterativa.
+ * \param idx Índice en donde insertar la clave.
+ * \param clave Clave a insertar.
+ * \param dato Dato a insertar
+ * \param nodo_id Id del nodo en el cual insertar la nueva clave.
+ * \param nodo FIXME Nodo en donde insertar??? No entiendo por que char*.
+ * \param hijo1 Id del nodo hijo de la izquierda del insertado.
+ * \param hijo2 Id del nodo hijo de la derecha del insertado.
+ */
+static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der);
+/** Inserta en un nodo en el que se sabe positivamente que hay lugar. */
+static void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der);
+/** Borra una clave del arbol */
+static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k);
+/** Le pide al hermano derecho del nodo una clave cuando se eliminan claves */
+static void b_pedir_clave_derecha(char *, int, char *, int, char *, int, int);
+/** Le pide al hermano izquierdo una clave cuando se eliminan claves */
+static void b_pedir_clave_izquierda(char *, int, char *, int, char *, int, int);
+/** Le pasa al hermano derecho del nodo una clave cuando se insertan claves */
+static void b_pasar_clave_a_derecha(INDICE*, char*, int, char*, int, int, B_NodoEntry);
+/** Le pasa al hermano izquierdo una clave cuando se insertan claves */
+static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_NodoEntry, int, int);
+/** Junta 2 nodos y hace uno solo */
+static void b_fundir_nodo(INDICE *,char *, int, char *, int, char *, int, int);
+
+static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo);
+
+static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
+static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
-void b_crear()
+void emufs_indice_b_crear(INDICE *idx)
{
FILE *fp;
char *bloque;
header.padre = -1;
header.hijo_izquierdo = -1;
- fp = fopen(FILENAME, "w");
+ fp = fopen(idx->filename, "w");
+ if (fp == NULL) {
+ PERR("Error al crear el archivo");
+ return;
+ }
/* Creo el archivo con el Nodo raiz */
- bloque = (char *)malloc(BLOCK_SIZE);
- memset(bloque, -1, BLOCK_SIZE);
+ bloque = (char *)malloc(idx->tam_bloque);
+ memset(bloque, -1, idx->tam_bloque);
memcpy(bloque, &header, sizeof(B_NodoHeader));
- fwrite(bloque, BLOCK_SIZE, 1, fp);
+ fwrite(bloque, idx->tam_bloque, 1, fp);
fclose(fp);
}
-int b_insertar(int clave, int ubicacion)
+int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato)
{
int i, nodo_id, padre_id;
B_NodoHeader header;
B_NodoEntry *claves;
char *nodo, *padre;
+ INDICE_DATO dummy;
/* Leo la raiz */
- nodo = b_leer_nodo(0);
+ nodo = b_leer_nodo(idx, 0);
padre_id = nodo_id = 0;
padre = NULL;
while (nodo) {
b_leer_header(nodo, &header);
claves = b_leer_claves(nodo, &header);
i=0;
- while ((i<header.cant) && (claves[i].clave < clave)) i++;
- if ((i<header.cant) && (claves[i].clave == clave)) {
- /* CLAVE DUPLICADA! */
- return 0;
+ while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++;
+ if ((i<header.cant) && (emufs_indice_es_igual(idx, claves[i].clave, clave))) {
+ if (idx->funcion == IND_PRIMARIO) {
+ PERR("Indice primario no puede contener claves duplicadas!");
+ PERR(idx->nombre);
+ return 0;
+ }
+
+ /* TODO : Implementar carga de valor en clave duplicada! */
+ b_insertar_dup_en_pos(idx, claves[i].dato, dato);
+
+ if (idx->tipo_dato == IDX_STRING) {
+ /* Tengo que sacar el texto repetido del archivo de textos */
+ idx->emu_string->borrar_registro(idx->emu_string, clave);
+ }
+ return 1;
} else {
if (i == 0) {
- if (header.nivel != 0) {
- nodo = b_leer_nodo(header.hijo_izquierdo);
- nodo_id = header.hijo_izquierdo;
- } else {
- nodo = NULL;
- nodo_id = -1;
- }
+ nodo = b_leer_nodo(idx, header.hijo_izquierdo);
+ nodo_id = header.hijo_izquierdo;
} else {
- if (header.nivel != 0) {
- nodo = b_leer_nodo(claves[i-1].ubicacion);
- nodo_id = claves[i-1].ubicacion;
- } else {
- nodo = NULL;
- nodo_id = -1;
- }
+ nodo = b_leer_nodo(idx, claves[i-1].hijo_derecho);
+ nodo_id = claves[i-1].hijo_derecho;
}
}
}
if (nodo) free(nodo);
nodo = padre;
nodo_id = padre_id;
- b_insertar_en_nodo(clave, ubicacion, nodo_id, nodo, -1, -1);
+
+ if (idx->funcion != IND_PRIMARIO) {
+ /* Agrego el DATO real al archivo de claves repetiras
+ * y me guardo el ID para poner en el indice
+ */
+ dummy.id = -1;
+ dato.id = b_insertar_dup_en_pos(idx, dummy, dato);
+ }
+
+ b_insertar_en_nodo(idx, clave, dato, nodo_id, nodo, -1, -1);
return 1; /* Agregar OK! */
}
-int b_buscar(int clave)
+INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave)
{
- int i, ret;
+ int i;
+ INDICE_DATO ret;
B_NodoHeader header;
B_NodoEntry *claves;
char *nodo, *tmp;
+ int nodo_id;
/* Leo la raiz */
- nodo = b_leer_nodo(0);
+ nodo = b_leer_nodo(idx, 0);
+ nodo_id = 0;
while (nodo) {
b_leer_header(nodo, &header);
claves = b_leer_claves(nodo, &header);
i=0;
- while ((i<header.cant) && (claves[i].clave < clave)) i++;
- if (claves[i].clave == clave) {
- ret = claves[i].ubicacion;
+ while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++;
+ if ((i<header.cant) && (emufs_indice_es_igual(idx, claves[i].clave, clave))) {
+ ret = claves[i].dato;
+ b_grabar_nodo(idx, nodo_id, nodo);
free(nodo);
return ret;
} else {
tmp = nodo;
+ b_grabar_nodo(idx, nodo_id, nodo);
if (i == 0) {
- nodo = b_leer_nodo(header.hijo_izquierdo);
- printf("Me voy a izquierda = %d\n", header.hijo_izquierdo);
+ nodo = b_leer_nodo(idx, header.hijo_izquierdo);
+ nodo_id = header.hijo_izquierdo;
} else {
- nodo = b_leer_nodo(claves[i-1].ubicacion);
- printf("Me voy a hijo=%li\n", claves[i-1].ubicacion);
+ nodo = b_leer_nodo(idx, claves[i-1].hijo_derecho);
+ nodo_id = claves[i-1].hijo_derecho;
}
free(tmp);
}
}
/* Nodo no encontrado */
- return -1;
+ ret.id = ret.bloque = -1;
+ return ret;
+}
+
+int emufs_indice_b_borrar(INDICE *idx, CLAVE k)
+{
+ /* Busco el nodo que contiene la clave,si es que esta existe */
+ char *nodo;
+ int nodo_id, i;
+ char encontrado=0;
+ B_NodoHeader header;
+ B_NodoEntry *claves;
+
+ nodo_id = 0; /* Tomo la raiz */
+ nodo = b_leer_nodo(idx, nodo_id);
+ while (nodo && !encontrado) {
+ /* Obtengo los datos del nodo */
+ b_leer_header(nodo, &header);
+ claves = b_leer_claves(nodo, &header);
+
+ i=0;
+ while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) i++;
+
+ if ((emufs_indice_es_igual(idx, claves[i].clave, k)) && (i<header.cant))
+ encontrado = 1;
+ else {
+ if (i==0) {
+ free(nodo);
+ nodo_id = header.hijo_izquierdo;
+ nodo = b_leer_nodo(idx, nodo_id);
+ } else {
+ nodo_id = claves[i-1].hijo_derecho;
+ free(nodo);
+ nodo = b_leer_nodo(idx, nodo_id);
+ }
+ }
+ }
+
+ if (encontrado) {
+ PERR("Clave encontrada, borrando ...");
+ fprintf(stderr, "La clave a borrar esta en el nodo %d\n", nodo_id);
+ b_borrar_clave(idx, nodo, nodo_id, k);
+ } else {
+ PERR("Clave no encontrada");
+ }
+ return 0;
}
-static int b_ultimo_id()
+static int b_ultimo_id(INDICE *idx)
{
int i;
FILE *fp;
- fp = fopen(FILENAME, "r");
+ fp = fopen(idx->filename, "r");
fseek(fp, 0, SEEK_END);
- i = ftell(fp)/BLOCK_SIZE;
+ i = ftell(fp)/idx->tam_bloque;
fclose(fp);
return i;
}
-static char *b_crear_nodo(int *id)
+static char *b_crear_nodo(INDICE *idx, int *id)
{
char *bloque;
B_NodoHeader header;
- (*id) = b_ultimo_id();
+ (*id) = b_ultimo_id(idx);
- printf("Nuevo nodo creado : id = %d\n", *id);
header.cant = 0;
header.nivel = 0;
header.hijo_izquierdo = -1;
header.padre = -1;
- bloque = (char *)malloc(BLOCK_SIZE);
- memset(bloque, -1, BLOCK_SIZE);
+ bloque = (char *)malloc(idx->tam_bloque);
+ memset(bloque, -1, idx->tam_bloque);
memcpy(bloque, &header, sizeof(B_NodoHeader));
- b_grabar_nodo(*id, bloque);
+ b_grabar_nodo(idx, *id, bloque);
return bloque;
}
-static char *b_leer_nodo(int id)
+char *b_leer_nodo(INDICE *idx, int id)
{
FILE *fp;
char *out;
+ B_NodoHeader header;
+ B_NodoEntry *claves;
if (id < 0) return NULL;
- fp = fopen(FILENAME, "r");
+ fp = fopen(idx->filename, "r");
if (fp == NULL) return NULL;
- fseek(fp, id*BLOCK_SIZE, SEEK_SET);
+ fseek(fp, id*idx->tam_bloque, SEEK_SET);
- out = (char *)malloc(BLOCK_SIZE);
+ out = (char *)malloc(idx->tam_bloque);
if (out == NULL) {
fclose(fp);
return NULL;
}
- if (fread(out, 1, BLOCK_SIZE, fp) != BLOCK_SIZE) {
+ if (fread(out, 1, idx->tam_bloque, fp) != idx->tam_bloque) {
free(out);
/* No se puso leer el nodo */
fclose(fp);
return NULL;
}
+ /* Si estoy manejando string tengo que sacar las abreviaturas */
+ if (idx->tipo_dato == IDX_STRING) {
+ b_leer_header(out, &header);
+ claves = b_leer_claves(out, &header);
+ desabreviar_claves(idx, claves, &header);
+ }
fclose(fp);
return out;
}
-static void b_grabar_nodo(int id, char *data)
+static void b_grabar_nodo(INDICE *idx, int id, char *data)
{
FILE *fp;
+ B_NodoHeader header;
+ B_NodoEntry *claves;
-/* if (id > b_ultimo_id()) {
- printf("AGREGANDO AL FINAL\n");
- fp = fopen(FILENAME, "a");
- if (fp == NULL) {
- _("No se pudo abrir archivo\n");
- return;
- }
- } else {
- fp = fopen(FILENAME, "w");
- if (fp == NULL) {
- _("No se pudo abrir archivo\n");
- return;
- }
- fseek(fp, id*BLOCK_SIZE, SEEK_SET);
- printf("SOLO GUARDO DATA\n");
- }*/
-
- fp = fopen(FILENAME, "r+");
- fseek(fp, id*BLOCK_SIZE, SEEK_SET);
- fwrite(data, 1, BLOCK_SIZE, fp);
+ /* Si las claves son de tipo string debo abreviar antes de guardar */
+ if (idx->tipo_dato == IDX_STRING) {
+ b_leer_header(data, &header);
+ claves = b_leer_claves(data, &header);
+ abreviar_claves(idx, claves, &header);
+ }
+ fp = fopen(idx->filename, "r+");
+ fseek(fp, id*idx->tam_bloque, SEEK_SET);
+ fwrite(data, 1, idx->tam_bloque, fp);
fclose(fp);
}
-static void b_leer_header(char *src, B_NodoHeader *header)
+void b_leer_header(char *src, B_NodoHeader *header)
{
if (!src) return;
memcpy(src, header, sizeof(B_NodoHeader));
}
-static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header)
+B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header)
{
return (B_NodoEntry *)(src+sizeof(B_NodoHeader));
}
-static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo, int hijo1, int hijo2)
+static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2)
{
char *padre, *nuevo;
int nuevo_id;
do {
if (!nodo) {
/* CREAR NODO? */
- nodo = b_crear_nodo(&nodo_id);
+ nodo = b_crear_nodo(idx, &nodo_id);
}
b_leer_header(nodo, &nodo_header);
claves = b_leer_claves(nodo, &nodo_header);
- padre = b_leer_nodo(nodo_header.padre);
+ padre = b_leer_nodo(idx, nodo_header.padre);
- if (nodo_header.cant == CANT_HIJOS) {
+ if (nodo_header.cant == CANT_HIJOS(idx)) {
int total;
- nuevo = b_crear_nodo(&nuevo_id);
+ /* TODO: Si es B*, hay que chequear si alguno de los 2
+ * nodos hermanos pueden prestarme espacio (y
+ * desplazar si es así). Si no pueden, hay que
+ * hacer un split de 2 nodos en 3.
+ * Si no es B*, hay que hacer lo que sigue:
+ */
+ nuevo = b_crear_nodo(idx, &nuevo_id);
i=0;
/* Creo una lista ordenada de los nodos a partir */
tmp_claves = (B_NodoEntry *)malloc(sizeof(B_NodoEntry)*(nodo_header.cant+1));
total = nodo_header.cant+1;
- while ((i<nodo_header.cant) && (claves[i].clave < clave)) {
+ while ((i<nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) {
tmp_claves[i] = claves[i];
i++;
}
tmp_claves[i].clave = clave;
- tmp_claves[i].ubicacion = ubicacion;
+ tmp_claves[i].dato = dato;
+ /*tmp_claves[i].hijo_derecho = hijo1;*/
+ if (i==0) {
+ nodo_header.hijo_izquierdo = hijo1;
+ tmp_claves[i].hijo_derecho = hijo2;
+ } else {
+ tmp_claves[i-1].hijo_derecho = hijo1;
+ tmp_claves[i].hijo_derecho = hijo2;
+ }
while (i < nodo_header.cant) {
tmp_claves[i+1] = claves[i];
i++;
nuevo_header.nivel = nodo_header.nivel;
nodo_header.cant = total/2;
- nuevo_header.cant = total - nodo_header.cant;
+ nuevo_header.cant = (total-1) - nodo_header.cant;
- memset(claves, '*', BLOCK_SIZE-sizeof(B_NodoHeader));
+ memset(claves, '*', idx->tam_bloque-sizeof(B_NodoHeader));
for(j=0; j<nodo_header.cant; j++)
claves[j] = tmp_claves[j];
claves_nuevo = b_leer_claves(nuevo, &nuevo_header);
- memset(claves_nuevo, '*', BLOCK_SIZE-sizeof(B_NodoHeader));
+ memset(claves_nuevo, '*', idx->tam_bloque-sizeof(B_NodoHeader));
for(j=0; j<nuevo_header.cant; j++)
- claves_nuevo[j] = tmp_claves[j+nodo_header.cant];
+ claves_nuevo[j] = tmp_claves[j+total/2+1];
b_actualizar_header(nodo, &nodo_header);
b_actualizar_header(nuevo, &nuevo_header);
if (nodo_id != 0) {
- clave = claves_nuevo[0].clave; /*tmp_claves[total/2].clave;*/
- ubicacion = nuevo_id;
+ clave = tmp_claves[total/2].clave;
+ dato = tmp_claves[total/2].dato;
- b_grabar_nodo(nodo_id, nodo);
- b_grabar_nodo(nuevo_id, nuevo);
+ b_grabar_nodo(idx, nodo_id, nodo);
+ b_grabar_nodo(idx, nuevo_id, nuevo);
free(nodo);
free(nuevo);
free(tmp_claves);
hijo1 = nodo_id;
hijo2 = nuevo_id;
+ fprintf(stderr, "Nodos espliteados = %d %d\n", hijo1, hijo2);
nodo = padre;
nodo_id = nodo_header.padre;
} else {
/* Oops, parti el raiz, y este debe quedar en 0, lo paso a otro bloque
* y dejo el padre vacio
*/
- char *tmp_nuevo = b_crear_nodo(&nodo_id);
- memcpy(tmp_nuevo, nodo, BLOCK_SIZE);
+ char *tmp_nuevo = b_crear_nodo(idx, &nodo_id);
+ memcpy(tmp_nuevo, nodo, idx->tam_bloque);
free(nodo);
nodo = tmp_nuevo;
- clave = claves_nuevo[0].clave; /*tmp_claves[total/2].clave;*/
- ubicacion = nodo_id; /*nuevo_id;*/
+ clave = tmp_claves[total/2].clave;
+ dato = tmp_claves[total/2].dato;
- b_grabar_nodo(nuevo_id+1, nodo);
- b_grabar_nodo(nuevo_id, nuevo);
+ b_grabar_nodo(idx, nuevo_id+1, nodo);
+ b_grabar_nodo(idx, nuevo_id, nuevo);
free(nodo);
free(nuevo);
hijo1 = nuevo_id+1;
hijo2 = nuevo_id;
+ fprintf(stderr, "Nodos espliteados = %d %d\n", hijo1, hijo2);
/* Limpio al padre */
- nuevo = b_leer_nodo(0);
+ nuevo = b_leer_nodo(idx, 0);
b_leer_header(nuevo, &nuevo_header);
nuevo_header.cant = 0;
nuevo_header.padre = -1;
nuevo_header.nivel = nodo_header.nivel+1;
- memset(nuevo, -1, BLOCK_SIZE);
+ nuevo_header.hijo_izquierdo = -1;
+ fprintf(stderr, "root.nivel=%d\n", nuevo_header.nivel);
+ memset(nuevo, -1, idx->tam_bloque);
b_actualizar_header(nuevo, &nuevo_header);
- b_grabar_nodo(0, nuevo);
+ b_grabar_nodo(idx, 0, nuevo);
nodo_id = 0;
nodo = nuevo;
}
} else {
/* La clave entra en este nodo!! */
- i = 0;
- if (nodo_header.cant > 0) {
- while ((claves[i].clave < clave) && (i < nodo_header.cant)) i++;
- for(j=nodo_header.cant; j > i; j--)
- claves[j] = claves[j-1];
+ b_insertar_en_nodo_con_lugar(idx, clave, dato, nodo_id, nodo, hijo1, hijo2);
+ salir = 1;
+ }
+ } while (!salir);
+}
+
+void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der)
+{
+ int i = 0;
+ B_NodoHeader nodo_header;
+ B_NodoEntry* claves;
+ b_leer_header(nodo, &nodo_header);
+ claves = b_leer_claves(nodo, &nodo_header);
+ if (nodo_header.cant > 0) {
+ int j;
+ while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++;
+ for(j=nodo_header.cant; j > i; j--)
+ claves[j] = claves[j-1];
+ }
+ nodo_header.cant++;
+ claves[i].clave = clave;
+ claves[i].dato = dato;
+ if (i==0) {
+ nodo_header.hijo_izquierdo = hijo_izq;
+ claves[i].hijo_derecho = hijo_der;
+ } else {
+ claves[i-1].hijo_derecho = hijo_izq;
+ claves[i].hijo_derecho = hijo_der;
+ }
+ /*b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);*/
+
+ b_actualizar_header(nodo, &nodo_header);
+ b_grabar_nodo(idx, nodo_id, nodo);
+
+ /* Debo actualizar los punteros al padre de los hijos */
+ if (hijo_izq != -1) {
+ char* nuevo = b_leer_nodo(idx, hijo_izq);
+ if (nuevo != NULL) {
+ B_NodoHeader nuevo_header;
+ fprintf(stderr, "Actualizo padre de %d a %d\n", hijo_izq, nodo_id);
+ b_leer_header(nuevo, &nuevo_header);
+ nuevo_header.padre = nodo_id;
+ b_actualizar_header(nuevo, &nuevo_header);
+ b_grabar_nodo(idx, hijo_izq, nuevo);
+ free(nuevo);
+ } else printf("FUCK! hijo_izq=%d no existe!\n", hijo_izq);
+ }
+ if (hijo_der != -1) {
+ char* nuevo = b_leer_nodo(idx, hijo_der);
+ if (nuevo != NULL) {
+ B_NodoHeader nuevo_header;
+ fprintf(stderr, "Actualizo padre de %d a %d\n", hijo_der, nodo_id);
+ b_leer_header(nuevo, &nuevo_header);
+ nuevo_header.padre = nodo_id;
+ b_actualizar_header(nuevo, &nuevo_header);
+ b_grabar_nodo(idx, hijo_der, nuevo);
+ free(nuevo);
+ } else printf("FUCK! hijo_der=%d no existe!\n", hijo_der);
+ }
+}
+
+void b_insertar_en_nodo_con_lugar_sin_hijo_izq(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_der)
+{
+ int i = 0;
+ B_NodoHeader nodo_header;
+ B_NodoEntry* claves;
+ b_leer_header(nodo, &nodo_header);
+ claves = b_leer_claves(nodo, &nodo_header);
+ if (nodo_header.cant > 0) {
+ int j;
+ while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++;
+ for(j=nodo_header.cant; j > i; j--)
+ claves[j] = claves[j-1];
+ }
+ nodo_header.cant++;
+ claves[i].clave = clave;
+ claves[i].dato = dato;
+ claves[i].hijo_derecho = hijo_der;
+
+ b_actualizar_header(nodo, &nodo_header);
+ b_grabar_nodo(idx, nodo_id, nodo);
+
+ /* Debo actualizar el puntero al padre del hijo */
+ if (hijo_der != -1) {
+ char* nuevo = b_leer_nodo(idx, hijo_der);
+ if (nuevo != NULL) {
+ B_NodoHeader nuevo_header;
+ b_leer_header(nuevo, &nuevo_header);
+ nuevo_header.padre = nodo_id;
+ b_actualizar_header(nuevo, &nuevo_header);
+ b_grabar_nodo(idx, hijo_der, nuevo);
+ free(nuevo);
+ } else printf("FUCK! hijo_der=%d no existe!\n", hijo_der);
+ }
+}
+
+INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant)
+{
+ EMUFS_REG_SIZE tam;
+ int error=0;
+ char *leido;
+ CLAVE k;
+ INDICE_DATO dato, *ret;
+
+ /* Si el indice es primario no tiene sentido hacer nada */
+ if (idx->funcion == IND_PRIMARIO) {
+ *cant = 0;
+ PERR("INDICE PRIMARIO NO SOPORTA BUSQUEDA MULTIPLE");
+ return NULL;
+ }
+
+ /* Busco la clave en el arbol */
+ dato = emufs_indice_b_buscar(idx, clave);
+
+ if (dato.id == -1) {
+ PERR("CLAvE NO ENCONTRADA EN EL ARBOL!");
+ }
+
+ /* Leo el contenido actual */
+ k.i_clave = dato.id;
+ error = 0;
+ leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error);
+
+ /* Incremento en 1 la cantidad */
+ if (leido != NULL)
+ (*cant) = *((int *)leido);
+ else
+ (*cant) = 0;
+
+ ret = malloc(sizeof(INDICE_DATO)*(*cant));
+ memcpy(ret, leido+sizeof(int), (*cant)*sizeof(INDICE_DATO));
+ free(leido);
+ return ret;
+}
+
+static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
+{
+ int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id, p;
+ B_NodoHeader header, header_actual, header_padre, header_izq, header_der;
+ B_NodoEntry *claves, *claves_actual, *claves_padre;/*, *claves_izq, *claves_der;*/
+ char *actual, *padre, *izq, *der;
+
+ PERR("Borrando clave");
+ b_leer_header(nodo, &header);
+ claves = b_leer_claves(nodo, &header);
+
+ pos = 0;
+ /* Busco la posicion dentro de la lista de claves */
+ PERR("Buscando lugar donde se encuentra la clave");
+ while (emufs_indice_es_menor(idx, claves[pos].clave, k)) pos++;
+
+ /* Es el nodo una hoja? */
+ fprintf(stderr, "La clave esta en la pos = %d\n", pos);
+ if (header.hijo_izquierdo != -1) {
+ PERR("Nodo no es hoja, intercambio");
+/* if (pos == 0) {
+ actual = b_leer_nodo(idx, nodo_header.hijo_izquierdo);
+ else*/
+ actual = b_leer_nodo(idx, claves[pos].hijo_derecho);
+ actual_id = claves[pos].hijo_derecho;
+ p = claves[pos].hijo_derecho;
+
+ b_leer_header(actual, &header_actual);
+ while (header_actual.hijo_izquierdo != -1) {
+ actual_id = header_actual.hijo_izquierdo;
+ free(actual);
+ actual = b_leer_nodo(idx, actual_id);
+ b_leer_header(actual, &header_actual);
+ }
+ claves_actual = b_leer_claves(actual, &header_actual);
+
+ claves[pos] = claves_actual[0];
+ claves[pos].hijo_derecho = p;
+ pos = 0;
+ b_grabar_nodo(idx, nodo_id, nodo);
+ PERR("Listo");
+ } else {
+ PERR("Nodo es hoja");
+ actual = nodo;
+ header_actual = header;
+ claves_actual = claves;
+ actual_id = nodo_id;
+ }
+
+ /* Borro la clave */
+ PERR("Borrando clave");
+ for(i=pos; i < header_actual.cant-1; i++) {
+ claves_actual[i] = claves_actual[i+1];
+ }
+ PERR("Borrado completo");
+ header_actual.cant--;
+ /* Guardo los cambios */
+ b_actualizar_header(actual, &header_actual);
+ b_grabar_nodo(idx, actual_id, actual);
+
+ /* Se cumple la condicion de hijos? */
+ PERR("Dejo todo consistente");
+ fprintf(stderr, "Condicion : %d >= %d\n", header_actual.cant, MIN_HIJOS(idx));
+ if (header_actual.cant >= MIN_HIJOS(idx)) {
+ PERR("Borrar completo sin fundir");
+ return;
+ }
+
+ PERR("Node queda con menos hijos de los posibles!");
+ /* Tengo que pasar datos o fundir nodos :-( */
+ do {
+ padre_id = header.padre;
+ padre = b_leer_nodo(idx, padre_id);
+ b_leer_header(padre, &header_padre);
+ claves_padre = b_leer_claves(padre, &header_padre);
+ fprintf(stderr, "ID del padre = %d de nivel %d\n", padre_id, header_padre.nivel);
+ /* TODO Tengo el hijo_izquierdo para revisar!! XXX */
+ if (header_padre.hijo_izquierdo == actual_id) {
+ PERR("Soy el hijo izquierdo de padre");
+ izquierda_id = -1; /* No tengo hermano izquierdo */
+ /* Mi hermano derecho es el primer nodo del padre */
+ derecha_id = claves_padre[0].hijo_derecho;
+ der = b_leer_nodo(idx, derecha_id);
+ b_leer_header(der, &header_der);
+ } else {
+ PERR("Buscando que hijo soy");
+ for(pos_padre=0; (claves_padre[pos_padre].hijo_derecho != actual_id); pos_padre++) { }
+
+ if (pos_padre == header_padre.cant) {
+ PERR("ERROR GRAVE. Padre no me contiene :-(");
}
- nodo_header.cant++;
- claves[i].clave = clave;
- claves[i].ubicacion = ubicacion;
- nodo_header.hijo_izquierdo = b_elegir_izquierdo(nodo_header.hijo_izquierdo, hijo1);
- b_actualizar_header(nodo, &nodo_header);
- b_grabar_nodo(nodo_id, nodo);
-
- /* Debo actualizar los punteros al padre de los hijos */
- if (hijo1 != -1) {
- nuevo = b_leer_nodo(hijo1);
- if (nuevo != NULL) {
- b_leer_header(nuevo, &nuevo_header);
- nuevo_header.padre = nodo_id;
- b_actualizar_header(nuevo, &nuevo_header);
- b_grabar_nodo(hijo1, nuevo);
- free(nuevo);
- } else printf("FUCK! hijo1=%d no existe!\n", hijo1);
+ /* Busco mis hermanos a derecha e izquierda, si es que existen */
+ PERR("Ya me encontre, busco a mis hermanos");
+ if (pos_padre >= 0) {
+ if (pos_padre == 0)
+ izquierda_id = header_padre.hijo_izquierdo;
+ else
+ izquierda_id = claves_padre[pos_padre-1].hijo_derecho;
+ izq = b_leer_nodo(idx, izquierda_id);
+ b_leer_header(izq, &header_izq);
+ } else {
+ izquierda_id = -1;
}
- if (hijo2 != -1) {
- nuevo = b_leer_nodo(hijo2);
- if (nuevo != NULL) {
- b_leer_header(nuevo, &nuevo_header);
- nuevo_header.padre = nodo_id;
- b_actualizar_header(nuevo, &nuevo_header);
- b_grabar_nodo(hijo2, nuevo);
- free(nuevo);
- } else printf("FUCK! hijo2=%d no existe!\n", hijo2);
+ if (pos_padre < header_padre.cant) {
+ derecha_id = claves_padre[pos_padre+1].hijo_derecho;
+ der = b_leer_nodo(idx, derecha_id);
+ b_leer_header(der, &header_der);
+ } else {
+ derecha_id = -1;
}
- salir = 1;
}
- } while (!salir);
+ /* Intendo pasar una clave desde un hermano hacia mi */
+ PERR("Ta calcule lo que tengo que hacer");
+ if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) {
+ PERR("Le pido clave a derecha");
+ fprintf(stderr, "ANTES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant);
+ b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre);
+ PERR("listo");
+ b_leer_header(der, &header_der);
+ b_leer_header(padre, &header_padre);
+ b_leer_header(actual, &header_actual);
+ fprintf(stderr, "DESPUES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant);
+ } else if ((izquierda_id != -1) && (header_izq.cant > MIN_HIJOS(idx))) {
+ PERR("Le pido clave a izquierda");
+ b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre);
+ /* como se modificaron cosas, leo de nuevo los headers */
+ b_leer_header(izq, &header_izq);
+ b_leer_header(padre, &header_padre);
+ b_leer_header(actual, &header_actual);
+ PERR("Listo");
+ } else {
+ /* No pude pasar clave, tengo que fundir :-( */
+ PERR("Fundo nodos!");
+ if (derecha_id != -1) {
+ b_fundir_nodo(idx, actual, actual_id, padre, padre_id, der, derecha_id, pos_padre);
+ } else {
+ b_fundir_nodo(idx, izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre);
+ }
+ }
+
+ /* TODO que guardo ?, todo ? */
+ b_grabar_nodo(idx, actual_id, actual);
+ if (izquierda_id != -1) b_grabar_nodo(idx, izquierda_id, izq);
+ if (derecha_id != -1) b_grabar_nodo(idx, derecha_id, der);
+ if (padre_id != -1) b_grabar_nodo(idx, padre_id, padre);
+ if (actual_id != -1) free(actual);
+ if (derecha_id != -1) free(der);
+ if (izquierda_id != -1) free(izq);
+ actual = padre;
+ actual_id = padre_id;
+ b_leer_header(actual, &header_actual);
+ claves_actual = b_leer_claves(actual, &header_actual);
+ } while ((actual_id != -1) && (actual_id != 0) && (header_actual.cant < MIN_HIJOS(idx)));
+}
+
+static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+{
+ int i;
+ B_NodoHeader h_der, h_padre, h_nodo;
+ B_NodoEntry *c_der, *c_padre, *c_nodo;
+
+ b_leer_header(nodo, &h_nodo);
+ c_nodo = b_leer_claves(nodo, &h_nodo);
+ b_leer_header(der, &h_der);
+ c_der = b_leer_claves(der, &h_der);
+ b_leer_header(padre, &h_padre);
+ c_padre = b_leer_claves(padre, &h_padre);
+
+ c_nodo[h_nodo.cant] = c_padre[pos_clave+1];
+ c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */
+
+ c_padre[pos_clave+1] = c_der[0];
+ c_padre[pos_clave+1].hijo_derecho = der_id;
+
+ /* Muevo las claves de derecho */
+ for(i=0; i<h_der.cant-1; i++) {
+ c_der[i] = c_der[i+1];
+ }
+ h_der.cant--;
+ h_nodo.cant++;
+
+ b_actualizar_header(der, &h_der);
+ b_actualizar_header(nodo, &h_nodo);
}
-const int b_elegir_izquierdo(int a, int b)
+void b_pasar_clave_a_derecha(INDICE *idx, char *der, int der_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry)
{
- int cual;
- char *nodo1, *nodo2;
- B_NodoHeader header1, header2;
- B_NodoEntry *claves1, *claves2;
+ B_NodoHeader padre_h, der_h;
+ B_NodoEntry* padre_entries;
+ /* Leo claves y cabecera del nodo de la derecha y del padre */
+ b_leer_header(padre, &padre_h);
+ b_leer_header(der, &der_h);
+ padre_entries = b_leer_claves(padre, &padre_h);
+ /* Inserto en el hijo derecho la clave del padre */
+ b_insertar_en_nodo_con_lugar(idx, padre_entries[padre_pos].clave, padre_entries[padre_pos].dato,
+ der_id, der, entry.hijo_derecho, der_h.hijo_izquierdo);
+ /* Reemplazo clave del padre por clave nueva */
+ entry.hijo_derecho = der_id;
+ padre_entries[padre_pos] = entry;
+}
- if (a==-1) return b;
- if (b==-1) return a;
+void b_pedir_clave_izquierda(char *izq, int izq_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+{
+ int i;
+ B_NodoHeader h_izq, h_padre, h_nodo;
+ B_NodoEntry *c_izq, *c_padre, *c_nodo;
+
+ b_leer_header(nodo, &h_nodo);
+ c_nodo = b_leer_claves(nodo, &h_nodo);
+ b_leer_header(izq, &h_izq);
+ c_izq = b_leer_claves(izq, &h_izq);
+ b_leer_header(padre, &h_padre);
+ c_padre = b_leer_claves(padre, &h_padre);
+
+ PERR("Muevo las claves");
+ for(i=h_nodo.cant; i>0;i--)
+ c_nodo[i] = c_nodo[i-1];
+
+ h_nodo.cant++;
+ PERR("Paso clave de padre a nodo");
+ c_nodo[0] = c_padre[pos_clave];
+ c_nodo[0].hijo_derecho = -1; /* XXX */
+ PERR("Paso clave de izquierda a padre");
+ c_padre[pos_clave] = c_izq[h_izq.cant-1];
+ c_padre[pos_clave].hijo_derecho = nodo_id;
+ h_izq.cant--;
+
+ PERR("ACTUALIZO")
+ b_actualizar_header(izq, &h_izq);
+ b_actualizar_header(padre, &h_padre);
+ b_actualizar_header(nodo, &h_nodo);
+ PERR("Salgo");
+}
- nodo1 = b_leer_nodo(a);
- nodo2 = b_leer_nodo(b);
+void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry, int id_entry_hijo_izq, int id_entry_nodo)
+{
+ B_NodoHeader padre_h;
+ B_NodoEntry* padre_entries;
+ /* Leo claves y cabecera del nodo de la izquierda y del padre */
+ b_leer_header(padre, &padre_h);
+ padre_entries = b_leer_claves(padre, &padre_h);
+ /* Inserto en el hijo izquirdo la clave del padre */
+ b_insertar_en_nodo_con_lugar_sin_hijo_izq(idx, padre_entries[padre_pos].clave, padre_entries[padre_pos].dato,
+ izq_id, izq, id_entry_hijo_izq);
+ /* Reemplazo clave del padre por clave nueva */
+ entry.hijo_derecho = id_entry_nodo;
+ padre_entries[padre_pos] = entry;
+}
- b_leer_header(nodo1, &header1);
- b_leer_header(nodo2, &header2);
+static void b_fundir_nodo(INDICE *idx, char *izq, int izq_id, char *padre, int padre_id, char *der, int der_id, int pos_padre)
+{
+ int i;
+ B_NodoHeader h_izq, h_padre, h_der;
+ B_NodoEntry *c_izq, *c_padre, *c_der;
+
+ b_leer_header(der, &h_der);
+ c_der = b_leer_claves(der, &h_der);
+ b_leer_header(izq, &h_izq);
+ c_izq = b_leer_claves(izq, &h_izq);
+ b_leer_header(padre, &h_padre);
+ c_padre = b_leer_claves(padre, &h_padre);
+
+ c_izq[h_izq.cant] = c_padre[pos_padre];
+ h_padre.cant--;
+ for(i=pos_padre; i<h_padre.cant; i++)
+ c_padre[i] = c_padre[i+1];
+ h_izq.cant++;
+ for(i=0; i<h_der.cant; i++)
+ c_izq[h_izq.cant+i] = c_der[i];
+
+ h_izq.cant += h_der.cant;
+
+ b_actualizar_header(izq, &h_izq);
+ b_actualizar_header(padre, &h_padre);
- claves1 = b_leer_claves(nodo1, &header1);
- claves2 = b_leer_claves(nodo2, &header2);
+ /* TODO Aca queda libre el nodo der, ver de recuperar! */
+ memset(der, 'X', idx->tam_bloque);
+ b_grabar_nodo(idx, der_id, der);
+}
- if (claves1[0].clave < claves2[0].clave)
- cual = a;
+static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo)
+{
+ int cant;
+ EMUFS_REG_SIZE tam;
+ int error=0;
+ INDICE_DATO *array;
+ char *leido;
+ CLAVE k;
+
+ /* Leo el contenido actual */
+ k.i_clave = pos.id;
+ error = 0;
+ leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error);
+
+ /* Incremento en 1 la cantidad */
+ if (leido != NULL)
+ cant = *((int *)leido);
else
- cual = b;
+ cant = 0;
+ cant++;
+
+ /* Obtengo un nuevo lugar para el dato nuevo */
+ /* Aca todo bien, si leido es NULL se compota como malloc */
+ leido = realloc(leido, cant*sizeof(INDICE_DATO)+sizeof(int));
+ array = (INDICE_DATO *)(leido+sizeof(int));
+
+ /* Pongo el dato nuevo */
+ array[cant-1] = nuevo;
+
+ /* Actualizo la cantidad */
+ (*((int *)leido)) = cant;
+
+ /* Salvo */
+ if (k.i_clave == -1) {
+ /* Creo uno nuevo */
+ error = 0;
+ k.i_clave = idx->emu_mult->grabar_registro(idx->emu_mult,
+ leido,
+ cant*sizeof(INDICE_DATO)+sizeof(int),
+ &error
+ );
+ if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!");
+ } else {
+ /* Modifico el que ya existia! */
+ error = 0;
+ idx->emu_mult->modificar_registro(idx->emu_mult,
+ k,
+ leido,
+ cant*sizeof(INDICE_DATO)+sizeof(int),
+ &error
+ );
+ }
+ /* Clean up! */
+ free(leido);
+ return k.i_clave;
+}
- free(nodo1);
- free(nodo2);
- return cual;
+char *abreviar(char *primera, char *actual, int *iguales)
+{
+ (*iguales) = 0;
+ while (((*primera) != '\0') && ((*actual) != '\0')) {
+ if ((*primera) == (*actual)) {
+ primera++;
+ actual++;
+ (*iguales)++;
+ } else {
+ /* No coinciden mas! */
+ break;
+ }
+ }
+
+ return actual;
+}
+
+static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header)
+{
+ char *primera, *actual, *resto, salvar[100];
+ EMUFS_REG_SIZE size;
+ int error, i;
+ int iguales;
+
+ /* Agarro la primer clave entera como referencia */
+ primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error);
+ for(i=1; i<header->cant; i++) {
+ actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error);
+ if (*actual == '*') {
+ free(actual);
+ continue;
+ }
+ resto = abreviar(primera, actual, &iguales);
+ /* Para que tenga sentido abreviar tengo que tener
+ * mas de 2 letras iguales, si no no gano nada y complica las cosas
+ */
+ if (iguales > 1) {
+ sprintf(salvar, "%d|%s", iguales, resto);
+ free(actual);
+ error = 0;
+ idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error);
+ } else {
+ free(primera);
+ primera = actual;
+ }
+ }
+
+ free(primera);
+}
+
+static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header)
+{
+ char *primera, *actual, *resto, salvar[100];
+ EMUFS_REG_SIZE size;
+ int error, i;
+ int iguales;
+
+ /* Agarro la primer clave entera como referencia */
+ primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error);
+ for(i=1; i<header->cant; i++) {
+ actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error);
+ if (*actual == '*') {
+ free(actual);
+ continue;
+ }
+ iguales = strtol(actual, &resto, 10);
+ if ((iguales > 0) && (*resto == '|')) {
+ strncpy(salvar, primera, iguales);
+ salvar[iguales] = '\0';
+ strcat(salvar, resto+1); /* +1 para saltar el separador */
+ idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error);
+ free(actual);
+ } else {
+ free(primera);
+ primera = actual;
+ }
+ }
+
+ free(primera);
}