X-Git-Url: https://git.llucax.com/z.facultad/75.06/emufs.git/blobdiff_plain/db30ec34669e71266f038fcf7cb2386fa210d531..e71b2f6ba15c4035c6fb10526b4ffd29d44b0ba2:/emufs/indice_b.c diff --git a/emufs/indice_b.c b/emufs/indice_b.c index b9cc9c3..228ed2b 100644 --- a/emufs/indice_b.c +++ b/emufs/indice_b.c @@ -1,25 +1,57 @@ #include "indice_b.h" - -#define FILENAME "b.idx" -#define BLOCK_SIZE 512 +#include "common.h" +#include "emufs.h" +#include "form.h" /* Cantidad de claves por nodo */ -#define CANT_HIJOS ((BLOCK_SIZE-sizeof(B_NodoHeader))/sizeof(B_NodoEntry)) -#define CANT_NODOS (CANT_HIJOS+1) -#define MIN_HIJOS (CANT_HIJOS/2) +#define CANT_HIJOS(x) ((x->tam_bloque-sizeof(B_NodoHeader))/sizeof(B_NodoEntry)) +#define CANT_NODOS(x) (CANT_HIJOS(x)+1) +#define MIN_HIJOS(x) (CANT_HIJOS(x)/2) /* Auxiliares */ -static void b_grabar_nodo(int id, char *data); -static int b_ultimo_id(); -static char *b_leer_nodo(int id); -static char *b_crear_nodo(); -static void b_leer_header(char *src, B_NodoHeader *header); +/** Graba el nodo en el archivo */ +static void b_grabar_nodo(INDICE *idx, int id, char *data); +/** Da el ID del proximo nodo a poder ser utilizado */ +static int b_ultimo_id(INDICE *idx); +/** Crea un nodo en el archivo y lo retorna. En i se pone el ID asignado */ +static char *b_crear_nodo(INDICE *idx, int *i); +/** Actualiza el header de un nodo desde header */ static void b_actualizar_header(char *src, B_NodoHeader *header); -static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header); -static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo, int hijo1, int hijo2); +/** Inserta una clave en el nodo de manera iterativa. + * \param idx Índice en donde insertar la clave. + * \param clave Clave a insertar. + * \param dato Dato a insertar + * \param nodo_id Id del nodo en el cual insertar la nueva clave. + * \param nodo FIXME Nodo en donde insertar??? No entiendo por que char*. + * \param hijo1 Id del nodo hijo de la izquierda del insertado. + * \param hijo2 Id del nodo hijo de la derecha del insertado. + */ +static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der); +/** Inserta en un nodo en el que se sabe positivamente que hay lugar. */ +static void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der); +/** Borra una clave del arbol */ +static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k); +/** Le pide al hermano derecho del nodo una clave cuando se eliminan claves */ +static void b_pedir_clave_derecha(char *, int, char *, int, char *, int, int); +/** Le pide al hermano izquierdo una clave cuando se eliminan claves */ +static void b_pedir_clave_izquierda(char *, int, char *, int, char *, int, int); +/** Le pasa al hermano derecho del nodo una clave cuando se insertan claves */ +static void b_pasar_clave_a_derecha(INDICE*, char*, int, char*, int, int, B_NodoEntry); +/** Le pasa al hermano izquierdo una clave cuando se insertan claves */ +static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_NodoEntry, int, int); +/** Junta 2 nodos y hace uno solo */ +static void b_fundir_nodo(INDICE *,char *, int, char *, int, char *, int, int); +/** Crea 3 nodos a partir de 2 llenos */ +static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre); + +static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo); + +static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); +static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); +int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k, INDICE_DATO dato); -void b_crear() +void emufs_indice_b_crear(INDICE *idx) { FILE *fp; char *bloque; @@ -30,27 +62,33 @@ void b_crear() header.padre = -1; header.hijo_izquierdo = -1; - fp = fopen(FILENAME, "w"); + fp = fopen(idx->filename, "w"); + if (fp == NULL) { + PERR("Error al crear el archivo"); + return; + } /* Creo el archivo con el Nodo raiz */ - bloque = (char *)malloc(BLOCK_SIZE); - memset(bloque, -1, BLOCK_SIZE); + bloque = (char *)malloc(idx->tam_bloque); + memset(bloque, -1, idx->tam_bloque); memcpy(bloque, &header, sizeof(B_NodoHeader)); - fwrite(bloque, BLOCK_SIZE, 1, fp); + fwrite(bloque, idx->tam_bloque, 1, fp); + free(bloque); fclose(fp); } -int b_insertar(int clave, int ubicacion) +int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) { int i, nodo_id, padre_id; B_NodoHeader header; B_NodoEntry *claves; char *nodo, *padre; + INDICE_DATO dummy; /* Leo la raiz */ - nodo = b_leer_nodo(0); + nodo = b_leer_nodo(idx, 0); padre_id = nodo_id = 0; padre = NULL; while (nodo) { @@ -60,27 +98,29 @@ int b_insertar(int clave, int ubicacion) b_leer_header(nodo, &header); claves = b_leer_claves(nodo, &header); i=0; - while ((ifuncion == IND_PRIMARIO) { + PERR("Indice primario no puede contener claves duplicadas!"); + PERR(idx->nombre); + return 0; + } + + if ((idx->funcion == IND_SELECCION) && (!emufs_indice_es_clave_nula(idx, clave))) + b_insertar_dup_en_pos(idx, claves[i].dato, dato); + + if (idx->tipo_dato == IDX_STRING) { + /* Tengo que sacar el texto repetido del archivo de textos */ + idx->emu_string->borrar_registro(idx->emu_string, clave, dummy); + } + return 1; } else { if (i == 0) { - if (header.nivel != 0) { - nodo = b_leer_nodo(header.hijo_izquierdo); - nodo_id = header.hijo_izquierdo; - } else { - nodo = NULL; - nodo_id = -1; - } + nodo = b_leer_nodo(idx, header.hijo_izquierdo); + nodo_id = header.hijo_izquierdo; } else { - if (header.nivel != 0) { - nodo = b_leer_nodo(claves[i-1].ubicacion); - nodo_id = claves[i-1].ubicacion; - } else { - nodo = NULL; - nodo_id = -1; - } + nodo = b_leer_nodo(idx, claves[i-1].hijo_derecho); + nodo_id = claves[i-1].hijo_derecho; } } } @@ -88,136 +128,207 @@ int b_insertar(int clave, int ubicacion) if (nodo) free(nodo); nodo = padre; nodo_id = padre_id; - b_insertar_en_nodo(clave, ubicacion, nodo_id, nodo, -1, -1); + + if (idx->funcion != IND_PRIMARIO) { + /* Agrego el DATO real al archivo de claves repetiras + * y me guardo el ID para poner en el indice + */ + if ((idx->funcion == IND_SELECCION) && (emufs_indice_es_clave_nula(idx, clave))) + /* UPS!, la clave que se va a insertar por primera vez es nula + * y soy un indice selectivo!, no lo puedo permitir, ciao!! + */ + return 1; + dummy.id = -1; + dato.id = b_insertar_dup_en_pos(idx, dummy, dato); + } + + b_insertar_en_nodo(idx, clave, dato, nodo_id, nodo, -1, -1); return 1; /* Agregar OK! */ } -int b_buscar(int clave) +INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave) { - int i, ret; + int i; + INDICE_DATO ret; B_NodoHeader header; B_NodoEntry *claves; char *nodo, *tmp; + int nodo_id; /* Leo la raiz */ - nodo = b_leer_nodo(0); + nodo = b_leer_nodo(idx, 0); + nodo_id = 0; while (nodo) { b_leer_header(nodo, &header); claves = b_leer_claves(nodo, &header); i=0; - while ((ifuncion != IND_PRIMARIO) { + /* Debo borrar primero la clave desde el archivo de + * claves repetidas, y si recien ahi me quedo sin claves, + * borrar la clave del arbol + */ + PERR("Vamos a borrar duplicados"); + encontrado = b_borrar_dup_clave(idx, claves[i].dato, dato); + } + if (encontrado) { + b_borrar_clave(idx, nodo, nodo_id, k); + } + } else { + PERR("Clave no encontrada"); + } + return 0; } -static int b_ultimo_id() +static int b_ultimo_id(INDICE *idx) { int i; FILE *fp; - fp = fopen(FILENAME, "r"); + fp = fopen(idx->filename, "r"); fseek(fp, 0, SEEK_END); - i = ftell(fp)/BLOCK_SIZE; + i = ftell(fp)/idx->tam_bloque; fclose(fp); return i; } -static char *b_crear_nodo(int *id) +static char *b_crear_nodo(INDICE *idx, int *id) { char *bloque; B_NodoHeader header; - (*id) = b_ultimo_id(); + (*id) = b_ultimo_id(idx); - printf("Nuevo nodo creado : id = %d\n", *id); header.cant = 0; header.nivel = 0; header.hijo_izquierdo = -1; header.padre = -1; - bloque = (char *)malloc(BLOCK_SIZE); - memset(bloque, -1, BLOCK_SIZE); + bloque = (char *)malloc(idx->tam_bloque); + memset(bloque, -1, idx->tam_bloque); memcpy(bloque, &header, sizeof(B_NodoHeader)); - b_grabar_nodo(*id, bloque); + b_grabar_nodo(idx, *id, bloque); return bloque; } -static char *b_leer_nodo(int id) +char *b_leer_nodo(INDICE *idx, int id) { FILE *fp; char *out; + /*B_NodoHeader header; + B_NodoEntry *claves;*/ if (id < 0) return NULL; - fp = fopen(FILENAME, "r"); + fp = fopen(idx->filename, "r"); if (fp == NULL) return NULL; - fseek(fp, id*BLOCK_SIZE, SEEK_SET); + fseek(fp, id*idx->tam_bloque, SEEK_SET); - out = (char *)malloc(BLOCK_SIZE); + out = (char *)malloc(idx->tam_bloque); if (out == NULL) { fclose(fp); return NULL; } - if (fread(out, 1, BLOCK_SIZE, fp) != BLOCK_SIZE) { + if (fread(out, 1, idx->tam_bloque, fp) != idx->tam_bloque) { free(out); /* No se puso leer el nodo */ fclose(fp); return NULL; } + /* Si estoy manejando string tengo que sacar las abreviaturas */ +/* if (idx->tipo_dato == IDX_STRING) { + b_leer_header(out, &header); + claves = b_leer_claves(out, &header); + desabreviar_claves(idx, claves, &header); + }*/ fclose(fp); return out; } -static void b_grabar_nodo(int id, char *data) +static void b_grabar_nodo(INDICE *idx, int id, char *data) { FILE *fp; + /*B_NodoHeader header; + B_NodoEntry *claves;*/ -/* if (id > b_ultimo_id()) { - printf("AGREGANDO AL FINAL\n"); - fp = fopen(FILENAME, "a"); - if (fp == NULL) { - _("No se pudo abrir archivo\n"); - return; - } - } else { - fp = fopen(FILENAME, "w"); - if (fp == NULL) { - _("No se pudo abrir archivo\n"); - return; - } - fseek(fp, id*BLOCK_SIZE, SEEK_SET); - printf("SOLO GUARDO DATA\n"); + /* Si las claves son de tipo string debo abreviar antes de guardar */ +/* if (idx->tipo_dato == IDX_STRING) { + b_leer_header(data, &header); + claves = b_leer_claves(data, &header); + abreviar_claves(idx, claves, &header); }*/ - - fp = fopen(FILENAME, "r+"); - fseek(fp, id*BLOCK_SIZE, SEEK_SET); - fwrite(data, 1, BLOCK_SIZE, fp); + fp = fopen(idx->filename, "r+"); + fseek(fp, id*idx->tam_bloque, SEEK_SET); + fwrite(data, 1, idx->tam_bloque, fp); fclose(fp); } -static void b_leer_header(char *src, B_NodoHeader *header) +void b_leer_header(char *src, B_NodoHeader *header) { if (!src) return; @@ -230,12 +341,12 @@ static void b_actualizar_header(char *src, B_NodoHeader *header) memcpy(src, header, sizeof(B_NodoHeader)); } -static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header) +B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header) { return (B_NodoEntry *)(src+sizeof(B_NodoHeader)); } -static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo, int hijo1, int hijo2) +static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2) { char *padre, *nuevo; int nuevo_id; @@ -248,26 +359,81 @@ static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo do { if (!nodo) { /* CREAR NODO? */ - nodo = b_crear_nodo(&nodo_id); + nodo = b_crear_nodo(idx, &nodo_id); } b_leer_header(nodo, &nodo_header); claves = b_leer_claves(nodo, &nodo_header); - padre = b_leer_nodo(nodo_header.padre); + padre = b_leer_nodo(idx, nodo_header.padre); - if (nodo_header.cant == CANT_HIJOS) { + if (nodo_header.cant == CANT_HIJOS(idx)) { int total; - nuevo = b_crear_nodo(&nuevo_id); + /* + * TODO FIXME XXX TODO FIXME XXX TODO FIXME XXX + * + ******************************************************* + * Pseudocódigo que explica que hay que hacer si es B* + * + * OJO! Si el nodo en el cual estoy insertando es el + * raíz, se maneja exactamente igual que en el B común, + * así que el if sería algo como: + * if (idx->tipo == IND_B_ASC && !es_raiz(nodo_id)) + ******************************************************* + * + * nuevo_entry = new entry(clave, dato, hijo_der) + * padre = get_padre(nodo) + * + * // Veo si puedo pasar a derecha + * hijo_derecho = get_hijo_derecho(padre) + * if (hijo_derecho != NULL && hijo_derecho.cantidad_entries < MAX_ENTRIES) + * buffer = new entries[MAX_ENTRIES+1] + * copiar_entries(buffer, nodo) + * insertar_ordenado(buffer, nuevo_entry) + * entry_a_pasar = get_entry_extremo_derecho(buffer) + * b_pasar_clave_a_derecha(idx, hijo_derecho, hijo_derecho.id, padre, padre.id, padre.posicion, entry_a_pasar) + * SALIR + * + * // Veo si puedo pasar a izquierda + * hijo_izquierdo = get_hijo_izquierdo(padre) + * if (hijo_izquierdo != NULL && hijo_izquierdo.cantidad_entries < MAX_ENTRIES) + * buffer = new entries[MAX_ENTRIES+1] + * copiar_entries(buffer, nodo) + * insertar_ordenado(buffer, nuevo_entry) + * entry_a_pasar = get_entry_extremo_izquierdo(buffer) + * b_pasar_clave_a_izquierda(idx, hijo_izquierdo, hijo_izquierdo.id, padre, padre.id, padre.posicion, entry_a_pasar) + * SALIR + * + * // Parto 2 nodos en 3. + * if (hijo_izquierdo != NULL) + * b_partir_dos_nodos_en_tres(idx, hijo_izquierdo, nodo, padre, nuevo_entry) + * else // Siempre alguno tiene que existir. + * b_partir_dos_nodos_en_tres(idx, nodo, hijo_derecho, padre, nuevo_entry) + * + * SALIR + * + ********************************************************************************** + * Fin de pseudocódigo, si no es B* se sigue haciendo lo que dice a continuación. * + ********************************************************************************** + */ + nuevo = b_crear_nodo(idx, &nuevo_id); i=0; /* Creo una lista ordenada de los nodos a partir */ tmp_claves = (B_NodoEntry *)malloc(sizeof(B_NodoEntry)*(nodo_header.cant+1)); total = nodo_header.cant+1; - while ((itam_bloque-sizeof(B_NodoHeader)); for(j=0; jtam_bloque-sizeof(B_NodoHeader)); for(j=0; jtam_bloque); free(nodo); nodo = tmp_nuevo; - clave = claves_nuevo[0].clave; /*tmp_claves[total/2].clave;*/ - ubicacion = nodo_id; /*nuevo_id;*/ + clave = tmp_claves[total/2].clave; + dato = tmp_claves[total/2].dato; - b_grabar_nodo(nuevo_id+1, nodo); - b_grabar_nodo(nuevo_id, nuevo); + b_grabar_nodo(idx, nuevo_id+1, nodo); + b_grabar_nodo(idx, nuevo_id, nuevo); free(nodo); free(nuevo); @@ -330,15 +496,16 @@ static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo hijo2 = nuevo_id; /* Limpio al padre */ - nuevo = b_leer_nodo(0); + nuevo = b_leer_nodo(idx, 0); b_leer_header(nuevo, &nuevo_header); nuevo_header.cant = 0; nuevo_header.padre = -1; nuevo_header.nivel = nodo_header.nivel+1; - memset(nuevo, -1, BLOCK_SIZE); + nuevo_header.hijo_izquierdo = -1; + memset(nuevo, -1, idx->tam_bloque); b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(0, nuevo); + b_grabar_nodo(idx, 0, nuevo); nodo_id = 0; nodo = nuevo; @@ -346,43 +513,896 @@ static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo } } else { /* La clave entra en este nodo!! */ - i = 0; - if (nodo_header.cant > 0) { - while ((claves[i].clave < clave) && (i < nodo_header.cant)) i++; - for(j=nodo_header.cant; j > i; j--) - claves[j] = claves[j-1]; + b_insertar_en_nodo_con_lugar(idx, clave, dato, nodo_id, nodo, hijo1, hijo2); + salir = 1; + } + } while (!salir); +} + +void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der) +{ + int i = 0; + B_NodoHeader nodo_header; + B_NodoEntry* claves; + b_leer_header(nodo, &nodo_header); + claves = b_leer_claves(nodo, &nodo_header); + if (nodo_header.cant > 0) { + int j; + while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++; + for(j=nodo_header.cant; j > i; j--) + claves[j] = claves[j-1]; + } + nodo_header.cant++; + claves[i].clave = clave; + claves[i].dato = dato; + if (i==0) { + nodo_header.hijo_izquierdo = hijo_izq; + claves[i].hijo_derecho = hijo_der; + } else { + claves[i-1].hijo_derecho = hijo_izq; + claves[i].hijo_derecho = hijo_der; + } + + b_actualizar_header(nodo, &nodo_header); + b_grabar_nodo(idx, nodo_id, nodo); + + /* Debo actualizar los punteros al padre de los hijos */ + if (hijo_izq != -1) { + char* nuevo = b_leer_nodo(idx, hijo_izq); + if (nuevo != NULL) { + B_NodoHeader nuevo_header; + b_leer_header(nuevo, &nuevo_header); + nuevo_header.padre = nodo_id; + b_actualizar_header(nuevo, &nuevo_header); + b_grabar_nodo(idx, hijo_izq, nuevo); + free(nuevo); + } else printf("FUCK! hijo_izq=%d no existe!\n", hijo_izq); + } + if (hijo_der != -1) { + char* nuevo = b_leer_nodo(idx, hijo_der); + if (nuevo != NULL) { + B_NodoHeader nuevo_header; + b_leer_header(nuevo, &nuevo_header); + nuevo_header.padre = nodo_id; + b_actualizar_header(nuevo, &nuevo_header); + b_grabar_nodo(idx, hijo_der, nuevo); + free(nuevo); + } else printf("FUCK! hijo_der=%d no existe!\n", hijo_der); + } +} + +void b_insertar_en_nodo_con_lugar_sin_hijo_izq(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_der) +{ + int i = 0; + B_NodoHeader nodo_header; + B_NodoEntry* claves; + b_leer_header(nodo, &nodo_header); + claves = b_leer_claves(nodo, &nodo_header); + if (nodo_header.cant > 0) { + int j; + while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++; + for(j=nodo_header.cant; j > i; j--) + claves[j] = claves[j-1]; + } + nodo_header.cant++; + claves[i].clave = clave; + claves[i].dato = dato; + claves[i].hijo_derecho = hijo_der; + + b_actualizar_header(nodo, &nodo_header); + b_grabar_nodo(idx, nodo_id, nodo); + + /* Debo actualizar el puntero al padre del hijo */ + if (hijo_der != -1) { + char* nuevo = b_leer_nodo(idx, hijo_der); + if (nuevo != NULL) { + B_NodoHeader nuevo_header; + b_leer_header(nuevo, &nuevo_header); + nuevo_header.padre = nodo_id; + b_actualizar_header(nuevo, &nuevo_header); + b_grabar_nodo(idx, hijo_der, nuevo); + free(nuevo); + } else printf("FUCK! hijo_der=%d no existe!\n", hijo_der); + } +} + +INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant) +{ + EMUFS_REG_SIZE tam; + int error=0; + char *leido; + CLAVE k; + INDICE_DATO dato, *ret; + + /* Si el indice es primario no tiene sentido hacer nada */ + if (idx->funcion == IND_PRIMARIO) { + *cant = 0; + PERR("INDICE PRIMARIO NO SOPORTA BUSQUEDA MULTIPLE"); + return NULL; + } + + /* Busco la clave en el arbol */ + dato = emufs_indice_b_buscar(idx, clave); + + if (dato.id == -1) { + PERR("CLAvE NO ENCONTRADA EN EL ARBOL!"); + } + + /* Leo el contenido actual */ + k.i_clave = dato.id; + error = 0; + leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error); + + /* Incremento en 1 la cantidad */ + if (leido != NULL) + (*cant) = *((int *)leido); + else + (*cant) = 0; + + ret = malloc(sizeof(INDICE_DATO)*(*cant)); + memcpy(ret, leido+sizeof(int), (*cant)*sizeof(INDICE_DATO)); + free(leido); + return ret; +} + +static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) +{ + int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id, p; + B_NodoHeader header, header_actual, header_padre, header_izq, header_der; + B_NodoEntry *claves, *claves_actual, *claves_padre;/*, *claves_izq, *claves_der;*/ + char *actual, *padre, *izq, *der; + + PERR("Borrando clave"); + b_leer_header(nodo, &header); + claves = b_leer_claves(nodo, &header); + + pos = 0; + /* Busco la posicion dentro de la lista de claves */ + PERR("Buscando lugar donde se encuentra la clave"); + while (emufs_indice_es_menor(idx, claves[pos].clave, k)) pos++; + + /* Es el nodo una hoja? */ + if (header.hijo_izquierdo != -1) { + PERR("Nodo no es hoja, intercambio"); + actual = b_leer_nodo(idx, claves[pos].hijo_derecho); + actual_id = claves[pos].hijo_derecho; + p = claves[pos].hijo_derecho; + + b_leer_header(actual, &header_actual); + while (header_actual.hijo_izquierdo != -1) { + actual_id = header_actual.hijo_izquierdo; + free(actual); + actual = b_leer_nodo(idx, actual_id); + b_leer_header(actual, &header_actual); + } + claves_actual = b_leer_claves(actual, &header_actual); + + claves[pos] = claves_actual[0]; + claves[pos].hijo_derecho = p; + pos = 0; + b_grabar_nodo(idx, nodo_id, nodo); + PERR("Listo"); + } else { + PERR("Nodo es hoja"); + actual = nodo; + header_actual = header; + claves_actual = claves; + actual_id = nodo_id; + } + + /* Borro la clave */ + PERR("Borrando clave"); + for(i=pos; i < header_actual.cant-1; i++) { + claves_actual[i] = claves_actual[i+1]; + } + PERR("Borrado completo"); + header_actual.cant--; + /* Guardo los cambios */ + b_actualizar_header(actual, &header_actual); + b_grabar_nodo(idx, actual_id, actual); + + /* Se cumple la condicion de hijos? */ + PERR("Dejo todo consistente"); + if ((header_actual.cant >= MIN_HIJOS(idx)) || (actual_id == 0)) { + PERR("Borrar completo sin fundir"); + return; + } + + PERR("Node queda con menos hijos de los posibles!"); + /* Tengo que pasar datos o fundir nodos :-( */ + do { + padre_id = header.padre; + if (padre_id == -1) continue; + padre = b_leer_nodo(idx, padre_id); + b_leer_header(padre, &header_padre); + claves_padre = b_leer_claves(padre, &header_padre); + /* TODO Tengo el hijo_izquierdo para revisar!! XXX */ + if (header_padre.hijo_izquierdo == actual_id) { + PERR("Soy el hijo izquierdo de padre"); + izquierda_id = -1; /* No tengo hermano izquierdo */ + /* Mi hermano derecho es el primer nodo del padre */ + derecha_id = claves_padre[0].hijo_derecho; + der = b_leer_nodo(idx, derecha_id); + b_leer_header(der, &header_der); + pos_padre = 0; + } else { + PERR("Buscando que hijo soy"); + for(pos_padre=0; (claves_padre[pos_padre].hijo_derecho != actual_id); pos_padre++) { } + + if (pos_padre == header_padre.cant) { + PERR("ERROR GRAVE. Padre no me contiene :-("); } - nodo_header.cant++; - claves[i].clave = clave; - claves[i].ubicacion = ubicacion; - nodo_header.hijo_izquierdo = hijo1; - b_actualizar_header(nodo, &nodo_header); - b_grabar_nodo(nodo_id, nodo); - - /* Debo actualizar los punteros al padre de los hijos */ - if (hijo1 != -1) { - nuevo = b_leer_nodo(hijo1); - if (nuevo != NULL) { - b_leer_header(nuevo, &nuevo_header); - nuevo_header.padre = nodo_id; - b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(hijo1, nuevo); - free(nuevo); - } else printf("FUCK! hijo1=%d no existe!\n", hijo1); + /* Busco mis hermanos a derecha e izquierda, si es que existen */ + PERR("Ya me encontre, busco a mis hermanos"); + if (pos_padre >= 0) { + if (pos_padre == 0) + izquierda_id = header_padre.hijo_izquierdo; + else + izquierda_id = claves_padre[pos_padre-1].hijo_derecho; + izq = b_leer_nodo(idx, izquierda_id); + b_leer_header(izq, &header_izq); + } else { + izquierda_id = -1; } - if (hijo2 != -1) { - nuevo = b_leer_nodo(hijo2); - if (nuevo != NULL) { - b_leer_header(nuevo, &nuevo_header); - nuevo_header.padre = nodo_id; - b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(hijo2, nuevo); - free(nuevo); - } else printf("FUCK! hijo2=%d no existe!\n", hijo2); + if (pos_padre < header_padre.cant) { + derecha_id = claves_padre[pos_padre+1].hijo_derecho; + der = b_leer_nodo(idx, derecha_id); + b_leer_header(der, &header_der); + } else { + derecha_id = -1; } - salir = 1; } - } while (!salir); + /* Intendo pasar una clave desde un hermano hacia mi */ + PERR("Ta calcule lo que tengo que hacer"); + if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) { + PERR("Le pido clave a derecha"); + b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre); + PERR("listo"); + b_leer_header(der, &header_der); + b_leer_header(padre, &header_padre); + b_leer_header(actual, &header_actual); + } else if ((izquierda_id != -1) && (header_izq.cant > MIN_HIJOS(idx))) { + PERR("Le pido clave a izquierda"); + b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre); + /* como se modificaron cosas, leo de nuevo los headers */ + b_leer_header(izq, &header_izq); + b_leer_header(padre, &header_padre); + b_leer_header(actual, &header_actual); + PERR("Listo"); + } else { + /* No pude pasar clave, tengo que fundir :-( */ + PERR("Fundo nodos!"); + if (derecha_id != -1) { + b_fundir_nodo(idx, actual, actual_id, padre, padre_id, der, derecha_id, pos_padre); + } else { + b_fundir_nodo(idx, izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre); + } + } + + /* TODO que guardo ?, todo ? */ + b_grabar_nodo(idx, actual_id, actual); + if (izquierda_id != -1) b_grabar_nodo(idx, izquierda_id, izq); + if (derecha_id != -1) b_grabar_nodo(idx, derecha_id, der); + if (padre_id != -1) b_grabar_nodo(idx, padre_id, padre); + if (actual_id != -1) free(actual); + if (derecha_id != -1) free(der); + if (izquierda_id != -1) free(izq); + actual = padre; + actual_id = padre_id; + b_leer_header(actual, &header_actual); + claves_actual = b_leer_claves(actual, &header_actual); + } while ((actual_id != -1) && (actual_id != 0) && (header_actual.cant < MIN_HIJOS(idx))); +} + +static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave) +{ + int i; + B_NodoHeader h_der, h_padre, h_nodo; + B_NodoEntry *c_der, *c_padre, *c_nodo; + + PERR("Derecha 1"); + b_leer_header(nodo, &h_nodo); + c_nodo = b_leer_claves(nodo, &h_nodo); + b_leer_header(der, &h_der); + c_der = b_leer_claves(der, &h_der); + b_leer_header(padre, &h_padre); + c_padre = b_leer_claves(padre, &h_padre); + + PERR("Derecha 2"); + c_nodo[h_nodo.cant] = c_padre[pos_clave+1]; + c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */ + + PERR("Derecha 3"); + c_padre[pos_clave+1] = c_der[0]; + c_padre[pos_clave+1].hijo_derecho = der_id; + + /* Muevo las claves de derecho */ + PERR("Derecha 4"); + for(i=0; i0;i--) + c_nodo[i] = c_nodo[i-1]; + + h_nodo.cant++; + PERR("Paso clave de padre a nodo"); + c_nodo[0] = c_padre[pos_clave]; + c_nodo[0].hijo_derecho = -1; /* XXX */ + PERR("Paso clave de izquierda a padre"); + c_padre[pos_clave] = c_izq[h_izq.cant-1]; + c_padre[pos_clave].hijo_derecho = nodo_id; + h_izq.cant--; + + PERR("ACTUALIZO") + b_actualizar_header(izq, &h_izq); + b_actualizar_header(padre, &h_padre); + b_actualizar_header(nodo, &h_nodo); + PERR("Salgo"); +} + +void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry, int id_entry_hijo_izq, int id_entry_nodo) +{ + B_NodoHeader padre_h; + B_NodoEntry* padre_entries; + /* Leo claves y cabecera del nodo de la izquierda y del padre */ + b_leer_header(padre, &padre_h); + padre_entries = b_leer_claves(padre, &padre_h); + /* Inserto en el hijo izquirdo la clave del padre */ + b_insertar_en_nodo_con_lugar_sin_hijo_izq(idx, padre_entries[padre_pos].clave, padre_entries[padre_pos].dato, + izq_id, izq, id_entry_hijo_izq); + /* Reemplazo clave del padre por clave nueva */ + entry.hijo_derecho = id_entry_nodo; + padre_entries[padre_pos] = entry; +} + +static void b_fundir_nodo(INDICE *idx, char *izq, int izq_id, char *padre, int padre_id, char *der, int der_id, int pos_padre) +{ + int i; + B_NodoHeader h_izq, h_padre, h_der; + B_NodoEntry *c_izq, *c_padre, *c_der; + + b_leer_header(der, &h_der); + c_der = b_leer_claves(der, &h_der); + b_leer_header(izq, &h_izq); + c_izq = b_leer_claves(izq, &h_izq); + b_leer_header(padre, &h_padre); + c_padre = b_leer_claves(padre, &h_padre); + + c_izq[h_izq.cant] = c_padre[pos_padre]; + h_padre.cant--; + for(i=pos_padre; itam_bloque); + b_grabar_nodo(idx, der_id, der); +} + +static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo) +{ + int cant; + EMUFS_REG_SIZE tam; + int error=0; + INDICE_DATO *array; + char *leido; + CLAVE k; + + /* Leo el contenido actual */ + k.i_clave = pos.id; + error = 0; + leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error); + + /* Incremento en 1 la cantidad */ + if (leido != NULL) + cant = *((int *)leido); + else + cant = 0; + cant++; + + /* Obtengo un nuevo lugar para el dato nuevo */ + /* Aca todo bien, si leido es NULL se compota como malloc */ + leido = realloc(leido, cant*sizeof(INDICE_DATO)+sizeof(int)); + array = (INDICE_DATO *)(leido+sizeof(int)); + + /* Pongo el dato nuevo */ + array[cant-1] = nuevo; + + /* Actualizo la cantidad */ + (*((int *)leido)) = cant; + + /* Salvo */ + if (k.i_clave == -1) { + /* Creo uno nuevo */ + error = 0; + k.i_clave = idx->emu_mult->grabar_registro(idx->emu_mult, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error + ); + if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!"); + } else { + /* Modifico el que ya existia! */ + INDICE_DATO dummy; + error = 0; + idx->emu_mult->modificar_registro(idx->emu_mult, + k, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error, + dummy + ); + } + /* Clean up! */ + free(leido); + return k.i_clave; +} + +char *abreviar(char *primera, char *actual, int *iguales) +{ + (*iguales) = 0; + while (((*primera) != '\0') && ((*actual) != '\0')) { + if ((*primera) == (*actual)) { + primera++; + actual++; + (*iguales)++; + } else { + /* No coinciden mas! */ + break; + } + } + + return actual; +} + +static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header) +{ + char *primera, *actual, *resto, salvar[100]; + EMUFS_REG_SIZE size; + int error, i; + int iguales; + + /* Agarro la primer clave entera como referencia */ + primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error); + for(i=1; icant; i++) { + actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error); + if (*actual == '*') { + free(actual); + continue; + } + resto = abreviar(primera, actual, &iguales); + /* Para que tenga sentido abreviar tengo que tener + * mas de 2 letras iguales, si no no gano nada y complica las cosas + */ + if (iguales > 1) { + INDICE_DATO dummy1; + sprintf(salvar, "%d|%s", iguales, resto); + free(actual); + error = 0; + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy1); + } else { + free(primera); + primera = actual; + } + } + + free(primera); +} + +static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header) +{ + char *primera, *actual, *resto, salvar[100]; + EMUFS_REG_SIZE size; + int error, i; + int iguales; + + /* Agarro la primer clave entera como referencia */ + primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error); + for(i=1; icant; i++) { + actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error); + if (*actual == '*') { + free(actual); + continue; + } + iguales = strtol(actual, &resto, 10); + if ((iguales > 0) && (*resto == '|')) { + INDICE_DATO dummy2; + strncpy(salvar, primera, iguales); + salvar[iguales] = '\0'; + strcat(salvar, resto+1); /* +1 para saltar el separador */ + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy2); + free(actual); + } else { + free(primera); + primera = actual; + } + } + + free(primera); +} + +void insertar_ordenado(INDICE *idx, B_NodoEntry *buffer, int cant, B_NodoEntry nuevo_entry) +{ + int i, pos; + for(i=0; (ipos; i--) + buffer[i] = buffer[i-1]; + + buffer[pos] = nuevo_entry; +} + +static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre) +{ + PERR("PARTIR 2 EN 3"); + B_NodoEntry *buffer; + char *izq, *der, *padre, *nuevo; + B_NodoEntry *c_der, *c_izq, *c_nuevo, prom1, prom2; + B_NodoHeader h_der, h_izq, h_nuevo; + int i, j, nodo_nuevo; + int cant_claves; + + /* Leo los nodos y los datos */ + der = b_leer_nodo(idx, nodo_der); + izq = b_leer_nodo(idx, nodo_izq); + + b_leer_header(der, &h_der); + b_leer_header(izq, &h_izq); + + c_der = b_leer_claves(der, &h_der); + c_izq = b_leer_claves(izq, &h_izq); + + cant_claves = 2*CANT_HIJOS(idx)+2; + buffer = malloc(cant_claves*sizeof(B_NodoEntry)); + + for(i=0, j=0; iemu_mult->leer_registro(idx->emu_mult, k, &tam, &error); + + if (leido == NULL) { + PERR("LEI CUALQUIER COSA, BUG?"); + return 1; + } + + cant = *((int *)leido); + + /* Obtengo un nuevo lugar para el dato nuevo */ + array = (INDICE_DATO *)(leido+sizeof(int)); + + /* busco pos de dato en array */ + for(pos=0; posemu_mult->borrar_registro(idx->emu_mult, k, dummy1); + return 0; + } + + /* Quito el elemento */ + leido = realloc(leido, sizeof(int)+cant*sizeof(INDICE_DATO)); + + /* Actualizo la cantidad */ + (*((int *)leido)) = cant; + + error = 0; + idx->emu_mult->modificar_registro(idx->emu_mult, + k, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error, + dummy1 + ); + + free(leido); + + return cant; +} + +#ifdef NO_TERMINAOD +EMUFS_Estadisticas emufs_indice_b_obtener_estadisticas(INDICE *idx) +{ + EMUFS_Estadisticas stats, st_string, st_multiples; + + stats.tam_archivo = emufs_common_get_file_size(idx->filename); + stats.cant_bloques = stats.tam_archivo/idx->tam_bloque; + } +#endif +#include "indice_b_asc.c"