#include "indice_b.h"
+#include "common.h"
/* Cantidad de claves por nodo */
#define CANT_HIJOS(x) ((x->tam_bloque-sizeof(B_NodoHeader))/sizeof(B_NodoEntry))
#define MIN_HIJOS(x) (CANT_HIJOS(x)/2)
/* Auxiliares */
+/** Graba el nodo en el archivo */
static void b_grabar_nodo(INDICE *idx, int id, char *data);
+/** Da el ID del proximo nodo a poder ser utilizado */
static int b_ultimo_id(INDICE *idx);
+/** Lee un nodo desde el archivo */
static char *b_leer_nodo(INDICE *idx, int id);
+/** Crea un nodo en el archivo y lo retorna. En i se pone el ID asignado */
static char *b_crear_nodo(INDICE *idx, int *i);
+/** Lee el header de un nodo y lo guarda en header */
static void b_leer_header(char *src, B_NodoHeader *header);
+/** Actualiza el header de un nodo desde header */
static void b_actualizar_header(char *src, B_NodoHeader *header);
+/** Retorna el array de claves del nodo (esta data modifica directamente el bloque
+ * por eso no es necesario usar un actualizar_claves
+ */
static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header);
-static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, int ubicacion, int nodo_id, char *nodo, int hijo1, int hijo2);
-const int b_elegir_izquierdo(INDICE *idx, int a, int b);
+/** Inserta una clave en el nodo de manera iterativa.
+ * \param idx Índice en donde insertar la clave.
+ * \param clave Clave a insertar.
+ * \param dato Dato a insertar
+ * \param nodo_id Id del nodo en el cual insertar la nueva clave.
+ * \param nodo FIXME Nodo en donde insertar??? No entiendo por que char*.
+ * \param hijo1 Id del nodo hijo de la izquierda del insertado.
+ * \param hijo2 Id del nodo hijo de la derecha del insertado.
+ */
+static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2);
+/** Inserta en un nodo en el que se sabe positivamente que hay lugar. */
+static void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2);
+/** Esto es para asegurar el orden de los hijos luego de partir, en el caso de que
+ * lo que se parta sea la raiz
+ */
+static int b_elegir_izquierdo(INDICE *idx, int a, int b);
+/** Borra una clave del arbol */
+static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k);
+/** Le pide al hermano derecho del nodo una clave cuando se eliminan claves */
+static void b_pedir_clave_derecha(char *, int, char *, int, char *, int, int);
+/** Le pide al hermano izquierdo una clave cuando se eliminan claves */
+static void b_pedir_clave_izquierda(char *, int, char *, int, char *, int, int);
+/** Le pasa al hermano derecho del nodo una clave cuando se insertan claves */
+static void b_pasar_clave_a_derecha(char *, int, char *, int, char *, int, int);
+/** Le pasa al hermano izquierdo una clave cuando se insertan claves */
+static void b_pasar_clave_a_izquierda(char *, int, char *, int, char *, int, int);
+/** Junta 2 nodos y hace uno solo */
+static void b_fundir_nodo(char *, int, char *, int, char *, int, int);
void emufs_indice_b_crear(INDICE *idx)
{
header.hijo_izquierdo = -1;
fp = fopen(idx->filename, "w");
+ PERR("Creando indice");
+ fprintf(stderr, "Archivo = (%s)\n", idx->filename);
+ if (fp == NULL) {
+ PERR("Error al crear el archivo");
+ return;
+ }
/* Creo el archivo con el Nodo raiz */
bloque = (char *)malloc(idx->tam_bloque);
fclose(fp);
}
-int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, int ubicacion)
+int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato)
{
int i, nodo_id, padre_id;
B_NodoHeader header;
return 0;
} else {
if (i == 0) {
- if (header.nivel != 0) {
- nodo = b_leer_nodo(idx, header.hijo_izquierdo);
- nodo_id = header.hijo_izquierdo;
- } else {
- nodo = NULL;
- nodo_id = -1;
- }
+ nodo = b_leer_nodo(idx, header.hijo_izquierdo);
+ nodo_id = header.hijo_izquierdo;
} else {
- if (header.nivel != 0) {
- nodo = b_leer_nodo(idx, claves[i-1].ubicacion);
- nodo_id = claves[i-1].ubicacion;
- } else {
- nodo = NULL;
- nodo_id = -1;
- }
+ nodo = b_leer_nodo(idx, claves[i-1].hijo_derecho);
+ nodo_id = claves[i-1].hijo_derecho;
}
}
}
if (nodo) free(nodo);
nodo = padre;
nodo_id = padre_id;
- b_insertar_en_nodo(idx, clave, ubicacion, nodo_id, nodo, -1, -1);
+ b_insertar_en_nodo(idx, clave, dato, nodo_id, nodo, -1, -1);
return 1; /* Agregar OK! */
}
-int emufs_indice_b_buscar(INDICE *idx, CLAVE clave)
+INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave)
{
- int i, ret;
+ int i;
+ INDICE_DATO ret;
B_NodoHeader header;
B_NodoEntry *claves;
char *nodo, *tmp;
i=0;
while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++;
if (emufs_indice_es_igual(idx, claves[i].clave, clave)) {
- ret = claves[i].ubicacion;
+ ret = claves[i].dato;
free(nodo);
return ret;
} else {
if (i == 0) {
nodo = b_leer_nodo(idx, header.hijo_izquierdo);
} else {
- nodo = b_leer_nodo(idx, claves[i-1].ubicacion);
+ nodo = b_leer_nodo(idx, claves[i-1].hijo_derecho);
}
free(tmp);
}
}
/* Nodo no encontrado */
- return -1;
+ ret.id = ret.bloque = -1;
+ return ret;
+}
+
+int emufs_indice_b_borrar(INDICE *idx, CLAVE k)
+{
+ /* Busco el nodo que contiene la clave,si es que esta existe */
+ char *nodo;
+ int nodo_id, i;
+ char encontrado=0;
+ B_NodoHeader header;
+ B_NodoEntry *claves;
+
+ nodo_id = 0; /* Tomo la raiz */
+ nodo = b_leer_nodo(idx, nodo_id);
+ PERR("Buscando clave a borrar");
+ while (nodo && !encontrado) {
+ /* Obtengo los datos del nodo */
+ b_leer_header(nodo, &header);
+ claves = b_leer_claves(nodo, &header);
+
+ i=0;
+ while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) i++;
+
+ if ((emufs_indice_es_igual(idx, claves[i].clave, k)) && (i<header.cant))
+ encontrado = 1;
+ else {
+ if (i==0) {
+ free(nodo);
+ nodo_id = header.hijo_izquierdo;
+ nodo = b_leer_nodo(idx, nodo_id);
+ } else {
+ nodo_id = claves[i-1].hijo_derecho;
+ free(nodo);
+ nodo = b_leer_nodo(idx, nodo_id);
+ }
+ }
+ }
+
+ if (encontrado) {
+ PERR("Clave encontrada, borrando ...");
+ b_borrar_clave(idx, nodo, nodo_id, k);
+ } else {
+ PERR("Clave no encontrada");
+ }
+ return 0;
}
static int b_ultimo_id(INDICE *idx)
return (B_NodoEntry *)(src+sizeof(B_NodoHeader));
}
-static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, int ubicacion, int nodo_id, char *nodo, int hijo1, int hijo2)
+static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2)
{
char *padre, *nuevo;
int nuevo_id;
if (nodo_header.cant == CANT_HIJOS(idx)) {
int total;
+ /* TODO: Si es B*, hay que chequear si alguno de los 2
+ * nodos hermanos pueden prestarme espacio (y
+ * desplazar si es así). Si no pueden, hay que
+ * hacer un split de 2 nodos en 3.
+ * Si no es B*, hay que hacer lo que sigue:
+ */
nuevo = b_crear_nodo(idx, &nuevo_id);
i=0;
/* Creo una lista ordenada de los nodos a partir */
i++;
}
tmp_claves[i].clave = clave;
- tmp_claves[i].ubicacion = ubicacion;
+ tmp_claves[i].dato = dato;
+ tmp_claves[i].hijo_derecho = hijo1;
+ tmp_claves[i+1].hijo_derecho = hijo2;
while (i < nodo_header.cant) {
tmp_claves[i+1] = claves[i];
i++;
if (nodo_id != 0) {
clave = tmp_claves[total/2].clave;
- ubicacion = nuevo_id;
+ /* XXX dato.bloque = nuevo_id; */
b_grabar_nodo(idx, nodo_id, nodo);
b_grabar_nodo(idx, nuevo_id, nuevo);
nodo = tmp_nuevo;
clave = tmp_claves[total/2].clave;
- ubicacion = nuevo_id;
+ /* XXX dato.bloque = nuevo_id; */
b_grabar_nodo(idx, nuevo_id+1, nodo);
b_grabar_nodo(idx, nuevo_id, nuevo);
}
} else {
/* La clave entra en este nodo!! */
- i = 0;
- if (nodo_header.cant > 0) {
- while ((emufs_indice_es_menor(idx, claves[i].clave, clave)) && (i < nodo_header.cant)) i++;
- for(j=nodo_header.cant; j > i; j--)
- claves[j] = claves[j-1];
- }
- nodo_header.cant++;
- claves[i].clave = clave;
- claves[i].ubicacion = ubicacion;
- nodo_header.hijo_izquierdo = b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);
-
- b_actualizar_header(nodo, &nodo_header);
- b_grabar_nodo(idx, nodo_id, nodo);
-
- /* Debo actualizar los punteros al padre de los hijos */
- if (hijo1 != -1) {
- nuevo = b_leer_nodo(idx, hijo1);
- if (nuevo != NULL) {
- b_leer_header(nuevo, &nuevo_header);
- nuevo_header.padre = nodo_id;
- b_actualizar_header(nuevo, &nuevo_header);
- b_grabar_nodo(idx, hijo1, nuevo);
- free(nuevo);
- } else printf("FUCK! hijo1=%d no existe!\n", hijo1);
- }
- if (hijo2 != -1) {
- nuevo = b_leer_nodo(idx, hijo2);
- if (nuevo != NULL) {
- b_leer_header(nuevo, &nuevo_header);
- nuevo_header.padre = nodo_id;
- b_actualizar_header(nuevo, &nuevo_header);
- b_grabar_nodo(idx, hijo2, nuevo);
- free(nuevo);
- } else printf("FUCK! hijo2=%d no existe!\n", hijo2);
- }
+ b_insertar_en_nodo_con_lugar(idx, clave, dato, nodo_id, nodo, hijo1, hijo2);
salir = 1;
}
} while (!salir);
}
-const int b_elegir_izquierdo(INDICE *idx, int a, int b)
+void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2)
+{
+ int i = 0;
+ B_NodoHeader nodo_header;
+ B_NodoEntry* claves;
+ b_leer_header(nodo, &nodo_header);
+ claves = b_leer_claves(nodo, &nodo_header);
+ if (nodo_header.cant > 0) {
+ int j;
+ while ((emufs_indice_es_menor(idx, claves[i].clave, clave)) && (i < nodo_header.cant)) i++;
+ for(j=nodo_header.cant; j > i; j--)
+ claves[j] = claves[j-1];
+ }
+ nodo_header.cant++;
+ claves[i].clave = clave;
+ claves[i].dato = dato;
+ claves[i].hijo_derecho = hijo2;
+ nodo_header.hijo_izquierdo = b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);
+
+ b_actualizar_header(nodo, &nodo_header);
+ b_grabar_nodo(idx, nodo_id, nodo);
+
+ /* Debo actualizar los punteros al padre de los hijos */
+ if (hijo1 != -1) {
+ char* nuevo = b_leer_nodo(idx, hijo1);
+ if (nuevo != NULL) {
+ B_NodoHeader nuevo_header;
+ b_leer_header(nuevo, &nuevo_header);
+ nuevo_header.padre = nodo_id;
+ b_actualizar_header(nuevo, &nuevo_header);
+ b_grabar_nodo(idx, hijo1, nuevo);
+ free(nuevo);
+ } else printf("FUCK! hijo1=%d no existe!\n", hijo1);
+ }
+ if (hijo2 != -1) {
+ char* nuevo = b_leer_nodo(idx, hijo2);
+ if (nuevo != NULL) {
+ B_NodoHeader nuevo_header;
+ b_leer_header(nuevo, &nuevo_header);
+ nuevo_header.padre = nodo_id;
+ b_actualizar_header(nuevo, &nuevo_header);
+ b_grabar_nodo(idx, hijo2, nuevo);
+ free(nuevo);
+ } else printf("FUCK! hijo2=%d no existe!\n", hijo2);
+ }
+}
+
+static int b_elegir_izquierdo(INDICE *idx, int a, int b)
{
int cual;
char *nodo1, *nodo2;
return cual;
}
+INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant)
+{
+ /* Si el indice es primario no tiene sentido hacer nada */
+ if (idx->funcion == IND_PRIMARIO) {
+ *cant = 0;
+ return NULL;
+ }
+
+ /* TODO Implementar indices con repeticion */
+ return NULL;
+}
+
+static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
+{
+ int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id;
+ B_NodoHeader header, header_actual, header_padre, header_izq, header_der;
+ B_NodoEntry *claves, *claves_actual, *claves_padre;/*, *claves_izq, *claves_der;*/
+ char *actual, *padre, *izq, *der;
+
+ b_leer_header(nodo, &header);
+ claves = b_leer_claves(nodo, &header);
+
+ pos = 0;
+ /* Busco la posicion dentro de la lista de claves */
+ while (emufs_indice_es_menor(idx, claves[pos].clave, k)) pos++;
+
+ /* Es el nodo una hoja? */
+ if (header.hijo_izquierdo != -1) {
+ /* No!, es un nodo intermedio!! */
+ if (pos == 0)
+ actual = b_leer_nodo(idx, header.hijo_izquierdo);
+ else
+ actual = b_leer_nodo(idx, claves[pos+1].hijo_derecho);
+
+ b_leer_header(actual, &header_actual);
+ while (header_actual.hijo_izquierdo != -1) {
+ actual_id = header_actual.hijo_izquierdo;
+ free(actual);
+ actual = b_leer_nodo(idx, actual_id);
+ b_leer_header(actual, &header_actual);
+ }
+ claves_actual = b_leer_claves(actual, &header);
+
+ claves[pos] = claves_actual[0];
+ pos = 0;
+ b_grabar_nodo(idx, nodo_id, nodo);
+ } else {
+ actual = nodo;
+ }
+
+ /* Borro la clave */
+ for(i=pos; i < header_actual.cant; i++) {
+ claves_actual[i] = claves_actual[i+1];
+ }
+ header_actual.cant--;
+ /* Guardo los cambios */
+ b_actualizar_header(actual, &header_actual);
+ b_grabar_nodo(idx, actual_id, actual);
+
+ /* Se cumple la condicion de hijos? */
+ if (header_actual.cant >= MIN_HIJOS(idx)) {
+ PERR("Borrar completo sin fundir");
+ return;
+ }
+
+ /* Tengo que pasar datos o fundir nodos :-( */
+ do {
+ padre_id = header.padre;
+ padre = b_leer_nodo(idx, padre_id);
+ b_leer_header(padre, &header_padre);
+ claves_padre = b_leer_claves(padre, &header_padre);
+ /* TODO Tengo el hijo_izquierdo para revisar!! XXX */
+ if (header_padre.hijo_izquierdo == actual_id) {
+ izquierda_id = -1; /* No tengo hermano izquierdo */
+ /* Mi hermano derecho es el primer nodo del padre */
+ derecha_id = claves_padre[0].hijo_derecho;
+ der = b_leer_nodo(idx, derecha_id);
+ b_leer_header(der, &header_der);
+ } else {
+ for(pos_padre=0; claves_padre[pos_padre].hijo_derecho != actual_id; pos_padre++) { }
+
+ /* Busco mis hermanos a derecha e izquierda, si es que existen */
+ if (pos_padre >= 0) {
+ if (pos_padre == 0)
+ izquierda_id = header_padre.hijo_izquierdo;
+ else
+ izquierda_id = claves_padre[pos_padre-1].hijo_derecho;
+ izq = b_leer_nodo(idx, izquierda_id);
+ b_leer_header(izq, &header_izq);
+ } else {
+ izquierda_id = -1;
+ }
+ if (pos_padre < header_padre.cant) {
+ derecha_id = claves_padre[pos_padre+1].hijo_derecho;
+ der = b_leer_nodo(idx, derecha_id);
+ b_leer_header(der, &header_der);
+ } else {
+ derecha_id = -1;
+ }
+ }
+ /* Intendo pasar una clave desde un hermano hacia mi */
+ if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) {
+ b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre);
+ } else if ((izquierda_id != -1) && (header_izq.cant > MIN_HIJOS(idx))) {
+ b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1);
+ } else {
+ /* No pude pasar clave, tengo que fundir :-( */
+ if (derecha_id != -1) {
+ b_fundir_nodo(actual, actual_id, padre, padre_id, der, derecha_id, pos_padre);
+ } else {
+ b_fundir_nodo(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1);
+ }
+ }
+
+ /* TODO que guardo ?, todo ? */
+ b_grabar_nodo(idx, actual_id, actual);
+ b_grabar_nodo(idx, izquierda_id, izq);
+ b_grabar_nodo(idx, derecha_id, der);
+ b_grabar_nodo(idx, padre_id, padre);
+ if (actual_id != -1) free(actual);
+ /*if (padre_id != -1) free(padre);*/
+ if (derecha_id != -1) free(der);
+ if (izquierda_id != -1) free(izq);
+ actual = padre;
+ actual_id = padre_id;
+ } while ((actual_id != -1) && (header_actual.cant < MIN_HIJOS(idx)));
+}
+
+static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+{
+ int i;
+ B_NodoHeader h_der, h_padre, h_nodo;
+ B_NodoEntry *c_der, *c_padre, *c_nodo;
+
+ b_leer_header(nodo, &h_nodo);
+ c_nodo = b_leer_claves(nodo, &h_nodo);
+ b_leer_header(der, &h_der);
+ c_der = b_leer_claves(der, &h_der);
+ b_leer_header(padre, &h_padre);
+ c_padre = b_leer_claves(padre, &h_padre);
+
+ c_nodo[h_nodo.cant] = c_padre[pos_clave];
+ c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */
+
+ c_padre[pos_clave] = c_der[0];
+ c_padre[pos_clave].hijo_derecho = der_id;
+
+ /* Muevo las claves de derecho */
+ for(i=0; i<h_der.cant; i++) {
+ c_der[i] = c_der[i+1];
+ }
+ h_der.cant--;
+ h_nodo.cant++;
+
+ b_actualizar_header(der, &h_der);
+ b_actualizar_header(nodo, &h_nodo);
+}
+
+static void b_pasar_clave_a_derecha(char *der, int der_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+{
+/* int i;
+ B_NodoHeader h_der, h_padre, h_nodo;
+ B_NodoEntry *c_der, *c_padre, *c_nodo;
+
+ b_leer_header(nodo, &h_nodo);
+ c_nodo = b_leer_claves(nodo, &h_nodo);
+ b_leer_header(der, &h_der);
+ c_der = b_leer_claves(der, &h_der);
+ b_leer_header(padre, &h_padre);
+ c_padre = b_leer_claves(padre, &h_padre);
+
+ c_nodo[h_nodo.cant] = c_padre[pos_clave];
+ c_nodo[h_nodo.cant].hijo_derecho = -1; / * XXX * /
+
+ c_padre[pos_clave] = c_der[0];
+ c_padre[pos_clave].hijo_derecho = der_id;
+
+ / * Muevo las claves de derecho * /
+ for(i=0; i<h_der.cant; i++) {
+ c_der[i] = c_der[i+1];
+ }
+ h_der.cant++;
+
+ b_actualizar_header(der, &h_der);
+ b_actualizar_header(nodo, &h_nodo);
+*/
+}
+
+static void b_pedir_clave_izquierda(char *izq, int izq_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+{
+ int i;
+ B_NodoHeader h_izq, h_padre, h_nodo;
+ B_NodoEntry *c_izq, *c_padre, *c_nodo;
+
+ b_leer_header(nodo, &h_nodo);
+ c_nodo = b_leer_claves(nodo, &h_nodo);
+ b_leer_header(izq, &h_izq);
+ c_izq = b_leer_claves(izq, &h_izq);
+ b_leer_header(padre, &h_padre);
+ c_padre = b_leer_claves(padre, &h_padre);
+
+ for(i=h_nodo.cant; i>0;i++)
+ c_nodo[i] = c_nodo[i-1];
+
+ h_nodo.cant++;
+ c_nodo[0] = c_padre[pos_clave];
+ c_nodo[0].hijo_derecho = -1; /* XXX */
+ c_padre[pos_clave] = c_izq[h_izq.cant-1];
+ c_padre[pos_clave].hijo_derecho = izq_id;
+ h_izq.cant--;
+
+ b_actualizar_header(izq, &h_izq);
+ b_actualizar_header(padre, &h_padre);
+ b_actualizar_header(nodo, &h_nodo);
+}
+
+static void b_pasar_clave_a_izquierda(char *izq, int izq_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+{
+/* int i;
+ B_NodoHeader h_izq, h_padre, h_nodo;
+ B_NodoEntry *c_izq, *c_padre, *c_nodo;
+
+ b_leer_header(nodo, &h_nodo);
+ c_nodo = b_leer_claves(nodo, &h_nodo);
+ b_leer_header(izq, &h_izq);
+ c_izq = b_leer_claves(izq, &h_izq);
+ b_leer_header(padre, &h_padre);
+ c_padre = b_leer_claves(padre, &h_padre);
+
+ for(i=h_nodo.cant; i>0;i++)
+ c_nodo[i] = c_nodo[i-1];
+
+ h_nodo.cant++;
+ c_nodo[0] = c_padre[pos_clave];
+ c_nodo[0].hijo_derecho = -1; / * XXX * /
+ c_padre[pos_clave] = c_izq[h_izq.cant-1];
+ c_padre[pos_clave].hijo_derecho = izq_id;
+ h_izq.cant--;
+
+ b_actualizar_header(izq, &h_izq);
+ b_actualizar_header(padre, &h_padre);
+ b_actualizar_header(nodo, &h_nodo);
+*/
+}
+
+static void b_fundir_nodo(char *izq, int izq_id, char *padre, int padre_id, char *der, int der_id, int pos_clave)
+{
+}
+