X-Git-Url: https://git.llucax.com/z.facultad/75.06/emufs.git/blobdiff_plain/ddc964cd151aae4713a5d2d658da986df7cd3441..4a18f94108cddb75f174fd814079aa032f15997d:/emufs/indice_b.c diff --git a/emufs/indice_b.c b/emufs/indice_b.c index d7f2d8f..db5e269 100644 --- a/emufs/indice_b.c +++ b/emufs/indice_b.c @@ -41,12 +41,15 @@ static void b_pasar_clave_a_derecha(INDICE*, char*, int, char*, int, int, B_Nodo /** Le pasa al hermano izquierdo una clave cuando se insertan claves */ static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_NodoEntry, int, int); /** Junta 2 nodos y hace uno solo */ -static void b_fundir_nodo(char *, int, char *, int, char *, int, int); +static void b_fundir_nodo(INDICE *,char *, int, char *, int, char *, int, int); +/** Crea 3 nodos a partir de 2 llenos */ +static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre); static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo); static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); +int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k, INDICE_DATO dato); void emufs_indice_b_crear(INDICE *idx) { @@ -72,6 +75,7 @@ void emufs_indice_b_crear(INDICE *idx) memcpy(bloque, &header, sizeof(B_NodoHeader)); fwrite(bloque, idx->tam_bloque, 1, fp); + free(bloque); fclose(fp); } @@ -101,13 +105,13 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) PERR(idx->nombre); return 0; } - - /* TODO : Implementar carga de valor en clave duplicada! */ - b_insertar_dup_en_pos(idx, claves[i].dato, dato); + + if ((idx->funcion == IND_SELECCION) && (!emufs_indice_es_clave_nula(idx, clave))) + b_insertar_dup_en_pos(idx, claves[i].dato, dato); if (idx->tipo_dato == IDX_STRING) { /* Tengo que sacar el texto repetido del archivo de textos */ - idx->emu_string->borrar_registro(idx->emu_string, clave); + idx->emu_string->borrar_registro(idx->emu_string, clave, dummy); } return 1; } else { @@ -129,6 +133,11 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) /* Agrego el DATO real al archivo de claves repetiras * y me guardo el ID para poner en el indice */ + if ((idx->funcion == IND_SELECCION) && (emufs_indice_es_clave_nula(idx, clave))) + /* UPS!, la clave que se va a insertar por primera vez es nula + * y soy un indice selectivo!, no lo puedo permitir, ciao!! + */ + return 1; dummy.id = -1; dato.id = b_insertar_dup_en_pos(idx, dummy, dato); } @@ -178,7 +187,7 @@ INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave) return ret; } -int emufs_indice_b_borrar(INDICE *idx, CLAVE k) +int emufs_indice_b_borrar(INDICE *idx, CLAVE k, INDICE_DATO dato) { /* Busco el nodo que contiene la clave,si es que esta existe */ char *nodo; @@ -214,8 +223,17 @@ int emufs_indice_b_borrar(INDICE *idx, CLAVE k) if (encontrado) { PERR("Clave encontrada, borrando ..."); - fprintf(stderr, "La clave a borrar esta en el nodo %d\n", nodo_id); - b_borrar_clave(idx, nodo, nodo_id, k); + if (idx->funcion != IND_PRIMARIO) { + /* Debo borrar primero la clave desde el archivo de + * claves repetidas, y si recien ahi me quedo sin claves, + * borrar la clave del arbol + */ + PERR("Vamos a borrar duplicados"); + encontrado = b_borrar_dup_clave(idx, claves[i].dato, dato); + } + if (encontrado) { + b_borrar_clave(idx, nodo, nodo_id, k); + } } else { PERR("Clave no encontrada"); } @@ -350,11 +368,52 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n if (nodo_header.cant == CANT_HIJOS(idx)) { int total; - /* TODO: Si es B*, hay que chequear si alguno de los 2 - * nodos hermanos pueden prestarme espacio (y - * desplazar si es así). Si no pueden, hay que - * hacer un split de 2 nodos en 3. - * Si no es B*, hay que hacer lo que sigue: + /* + * TODO FIXME XXX TODO FIXME XXX TODO FIXME XXX + * + ******************************************************* + * Pseudocódigo que explica que hay que hacer si es B* + * + * OJO! Si el nodo en el cual estoy insertando es el + * raíz, se maneja exactamente igual que en el B común, + * así que el if sería algo como: + * if (idx->tipo == IND_B_ASC && !es_raiz(nodo_id)) + ******************************************************* + * + * nuevo_entry = new entry(clave, dato, hijo_der) + * padre = get_padre(nodo) + * + * // Veo si puedo pasar a derecha + * hijo_derecho = get_hijo_derecho(padre) + * if (hijo_derecho != NULL && hijo_derecho.cantidad_entries < MAX_ENTRIES) + * buffer = new entries[MAX_ENTRIES+1] + * copiar_entries(buffer, nodo) + * insertar_ordenado(buffer, nuevo_entry) + * entry_a_pasar = get_entry_extremo_derecho(buffer) + * b_pasar_clave_a_derecha(idx, hijo_derecho, hijo_derecho.id, padre, padre.id, padre.posicion, entry_a_pasar) + * SALIR + * + * // Veo si puedo pasar a izquierda + * hijo_izquierdo = get_hijo_izquierdo(padre) + * if (hijo_izquierdo != NULL && hijo_izquierdo.cantidad_entries < MAX_ENTRIES) + * buffer = new entries[MAX_ENTRIES+1] + * copiar_entries(buffer, nodo) + * insertar_ordenado(buffer, nuevo_entry) + * entry_a_pasar = get_entry_extremo_izquierdo(buffer) + * b_pasar_clave_a_izquierda(idx, hijo_izquierdo, hijo_izquierdo.id, padre, padre.id, padre.posicion, entry_a_pasar) + * SALIR + * + * // Parto 2 nodos en 3. + * if (hijo_izquierdo != NULL) + * b_partir_dos_nodos_en_tres(idx, hijo_izquierdo, nodo, padre, nuevo_entry) + * else // Siempre alguno tiene que existir. + * b_partir_dos_nodos_en_tres(idx, nodo, hijo_derecho, padre, nuevo_entry) + * + * SALIR + * + ********************************************************************************** + * Fin de pseudocódigo, si no es B* se sigue haciendo lo que dice a continuación. * + ********************************************************************************** */ nuevo = b_crear_nodo(idx, &nuevo_id); i=0; @@ -412,7 +471,6 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n hijo1 = nodo_id; hijo2 = nuevo_id; - fprintf(stderr, "Nodos espliteados = %d %d\n", hijo1, hijo2); nodo = padre; nodo_id = nodo_header.padre; } else { @@ -437,7 +495,6 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n hijo1 = nuevo_id+1; hijo2 = nuevo_id; - fprintf(stderr, "Nodos espliteados = %d %d\n", hijo1, hijo2); /* Limpio al padre */ nuevo = b_leer_nodo(idx, 0); @@ -446,7 +503,6 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n nuevo_header.padre = -1; nuevo_header.nivel = nodo_header.nivel+1; nuevo_header.hijo_izquierdo = -1; - fprintf(stderr, "root.nivel=%d\n", nuevo_header.nivel); memset(nuevo, -1, idx->tam_bloque); b_actualizar_header(nuevo, &nuevo_header); b_grabar_nodo(idx, 0, nuevo); @@ -486,7 +542,6 @@ void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, in claves[i-1].hijo_derecho = hijo_izq; claves[i].hijo_derecho = hijo_der; } - /*b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);*/ b_actualizar_header(nodo, &nodo_header); b_grabar_nodo(idx, nodo_id, nodo); @@ -496,7 +551,6 @@ void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, in char* nuevo = b_leer_nodo(idx, hijo_izq); if (nuevo != NULL) { B_NodoHeader nuevo_header; - fprintf(stderr, "Actualizo padre de %d a %d\n", hijo_izq, nodo_id); b_leer_header(nuevo, &nuevo_header); nuevo_header.padre = nodo_id; b_actualizar_header(nuevo, &nuevo_header); @@ -508,7 +562,6 @@ void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, in char* nuevo = b_leer_nodo(idx, hijo_der); if (nuevo != NULL) { B_NodoHeader nuevo_header; - fprintf(stderr, "Actualizo padre de %d a %d\n", hijo_der, nodo_id); b_leer_header(nuevo, &nuevo_header); nuevo_header.padre = nodo_id; b_actualizar_header(nuevo, &nuevo_header); @@ -594,7 +647,7 @@ INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant) static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) { - int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id; + int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id, p; B_NodoHeader header, header_actual, header_padre, header_izq, header_der; B_NodoEntry *claves, *claves_actual, *claves_padre;/*, *claves_izq, *claves_der;*/ char *actual, *padre, *izq, *der; @@ -609,14 +662,11 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) while (emufs_indice_es_menor(idx, claves[pos].clave, k)) pos++; /* Es el nodo una hoja? */ - fprintf(stderr, "La clave esta en la pos = %d\n", pos); if (header.hijo_izquierdo != -1) { PERR("Nodo no es hoja, intercambio"); - /* No!, es un nodo intermedio!! */ - if (pos == 0) - actual = b_leer_nodo(idx, header.hijo_izquierdo); - else - actual = b_leer_nodo(idx, claves[pos+1].hijo_derecho); + actual = b_leer_nodo(idx, claves[pos].hijo_derecho); + actual_id = claves[pos].hijo_derecho; + p = claves[pos].hijo_derecho; b_leer_header(actual, &header_actual); while (header_actual.hijo_izquierdo != -1) { @@ -625,9 +675,10 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) actual = b_leer_nodo(idx, actual_id); b_leer_header(actual, &header_actual); } - claves_actual = b_leer_claves(actual, &header); + claves_actual = b_leer_claves(actual, &header_actual); claves[pos] = claves_actual[0]; + claves[pos].hijo_derecho = p; pos = 0; b_grabar_nodo(idx, nodo_id, nodo); PERR("Listo"); @@ -652,8 +703,7 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) /* Se cumple la condicion de hijos? */ PERR("Dejo todo consistente"); - fprintf(stderr, "Condicion : %d >= %d\n", header_actual.cant, MIN_HIJOS(idx)); - if (header_actual.cant >= MIN_HIJOS(idx)) { + if ((header_actual.cant >= MIN_HIJOS(idx)) || (actual_id == 0)) { PERR("Borrar completo sin fundir"); return; } @@ -662,10 +712,10 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) /* Tengo que pasar datos o fundir nodos :-( */ do { padre_id = header.padre; + if (padre_id == -1) continue; padre = b_leer_nodo(idx, padre_id); b_leer_header(padre, &header_padre); claves_padre = b_leer_claves(padre, &header_padre); - fprintf(stderr, "ID del padre = %d de nivel %d\n", padre_id, header_padre.nivel); /* TODO Tengo el hijo_izquierdo para revisar!! XXX */ if (header_padre.hijo_izquierdo == actual_id) { PERR("Soy el hijo izquierdo de padre"); @@ -674,6 +724,7 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) derecha_id = claves_padre[0].hijo_derecho; der = b_leer_nodo(idx, derecha_id); b_leer_header(der, &header_der); + pos_padre = 0; } else { PERR("Buscando que hijo soy"); for(pos_padre=0; (claves_padre[pos_padre].hijo_derecho != actual_id); pos_padre++) { } @@ -706,16 +757,14 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) PERR("Ta calcule lo que tengo que hacer"); if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) { PERR("Le pido clave a derecha"); - fprintf(stderr, "ANTES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant); b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre); PERR("listo"); b_leer_header(der, &header_der); b_leer_header(padre, &header_padre); b_leer_header(actual, &header_actual); - fprintf(stderr, "DESPUES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant); } else if ((izquierda_id != -1) && (header_izq.cant > MIN_HIJOS(idx))) { PERR("Le pido clave a izquierda"); - b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1); + b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre); /* como se modificaron cosas, leo de nuevo los headers */ b_leer_header(izq, &header_izq); b_leer_header(padre, &header_padre); @@ -725,17 +774,17 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) /* No pude pasar clave, tengo que fundir :-( */ PERR("Fundo nodos!"); if (derecha_id != -1) { - b_fundir_nodo(actual, actual_id, padre, padre_id, der, derecha_id, pos_padre); + b_fundir_nodo(idx, actual, actual_id, padre, padre_id, der, derecha_id, pos_padre); } else { - b_fundir_nodo(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1); + b_fundir_nodo(idx, izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre); } } /* TODO que guardo ?, todo ? */ b_grabar_nodo(idx, actual_id, actual); - b_grabar_nodo(idx, izquierda_id, izq); - b_grabar_nodo(idx, derecha_id, der); - b_grabar_nodo(idx, padre_id, padre); + if (izquierda_id != -1) b_grabar_nodo(idx, izquierda_id, izq); + if (derecha_id != -1) b_grabar_nodo(idx, derecha_id, der); + if (padre_id != -1) b_grabar_nodo(idx, padre_id, padre); if (actual_id != -1) free(actual); if (derecha_id != -1) free(der); if (izquierda_id != -1) free(izq); @@ -752,6 +801,7 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_ B_NodoHeader h_der, h_padre, h_nodo; B_NodoEntry *c_der, *c_padre, *c_nodo; + PERR("Derecha 1"); b_leer_header(nodo, &h_nodo); c_nodo = b_leer_claves(nodo, &h_nodo); b_leer_header(der, &h_der); @@ -759,13 +809,16 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_ b_leer_header(padre, &h_padre); c_padre = b_leer_claves(padre, &h_padre); + PERR("Derecha 2"); c_nodo[h_nodo.cant] = c_padre[pos_clave+1]; c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */ + PERR("Derecha 3"); c_padre[pos_clave+1] = c_der[0]; c_padre[pos_clave+1].hijo_derecho = der_id; /* Muevo las claves de derecho */ + PERR("Derecha 4"); for(i=0; i0;i++) + PERR("Muevo las claves"); + for(i=h_nodo.cant; i>0;i--) c_nodo[i] = c_nodo[i-1]; h_nodo.cant++; + PERR("Paso clave de padre a nodo"); c_nodo[0] = c_padre[pos_clave]; c_nodo[0].hijo_derecho = -1; /* XXX */ + PERR("Paso clave de izquierda a padre"); c_padre[pos_clave] = c_izq[h_izq.cant-1]; - c_padre[pos_clave].hijo_derecho = izq_id; + c_padre[pos_clave].hijo_derecho = nodo_id; h_izq.cant--; + PERR("ACTUALIZO") b_actualizar_header(izq, &h_izq); b_actualizar_header(padre, &h_padre); b_actualizar_header(nodo, &h_nodo); + PERR("Salgo"); } void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry, int id_entry_hijo_izq, int id_entry_nodo) @@ -835,8 +895,35 @@ void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, padre_entries[padre_pos] = entry; } -static void b_fundir_nodo(char *izq, int izq_id, char *padre, int padre_id, char *der, int der_id, int pos_clave) +static void b_fundir_nodo(INDICE *idx, char *izq, int izq_id, char *padre, int padre_id, char *der, int der_id, int pos_padre) { + int i; + B_NodoHeader h_izq, h_padre, h_der; + B_NodoEntry *c_izq, *c_padre, *c_der; + + b_leer_header(der, &h_der); + c_der = b_leer_claves(der, &h_der); + b_leer_header(izq, &h_izq); + c_izq = b_leer_claves(izq, &h_izq); + b_leer_header(padre, &h_padre); + c_padre = b_leer_claves(padre, &h_padre); + + c_izq[h_izq.cant] = c_padre[pos_padre]; + h_padre.cant--; + for(i=pos_padre; itam_bloque); + b_grabar_nodo(idx, der_id, der); } static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo) @@ -883,12 +970,14 @@ static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_D if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!"); } else { /* Modifico el que ya existia! */ + INDICE_DATO dummy; error = 0; idx->emu_mult->modificar_registro(idx->emu_mult, k, leido, cant*sizeof(INDICE_DATO)+sizeof(int), - &error + &error, + dummy ); } /* Clean up! */ @@ -933,10 +1022,11 @@ static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *heade * mas de 2 letras iguales, si no no gano nada y complica las cosas */ if (iguales > 1) { + INDICE_DATO dummy1; sprintf(salvar, "%d|%s", iguales, resto); free(actual); error = 0; - idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error); + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy1); } else { free(primera); primera = actual; @@ -963,10 +1053,11 @@ static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *he } iguales = strtol(actual, &resto, 10); if ((iguales > 0) && (*resto == '|')) { + INDICE_DATO dummy2; strncpy(salvar, primera, iguales); salvar[iguales] = '\0'; strcat(salvar, resto+1); /* +1 para saltar el separador */ - idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error); + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy2); free(actual); } else { free(primera); @@ -977,3 +1068,341 @@ static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *he free(primera); } +void insertar_ordenado(INDICE *idx, B_NodoEntry *buffer, int cant, B_NodoEntry nuevo_entry) +{ + int i, pos; + for(i=0; (ipos; i--) + buffer[i] = buffer[i-1]; + + buffer[pos] = nuevo_entry; +} + +static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre) +{ + PERR("PARTIR 2 EN 3"); + B_NodoEntry *buffer; + char *izq, *der, *padre, *nuevo; + B_NodoEntry *c_der, *c_izq, *c_nuevo, prom1, prom2; + B_NodoHeader h_der, h_izq, h_nuevo; + int i, j, nodo_nuevo; + int cant_claves; + + /* Leo los nodos y los datos */ + der = b_leer_nodo(idx, nodo_der); + izq = b_leer_nodo(idx, nodo_izq); + + b_leer_header(der, &h_der); + b_leer_header(izq, &h_izq); + + c_der = b_leer_claves(der, &h_der); + c_izq = b_leer_claves(izq, &h_izq); + + cant_claves = 2*CANT_HIJOS(idx)+2; + buffer = malloc(cant_claves*sizeof(B_NodoEntry)); + + for(i=0, j=0; iemu_mult->leer_registro(idx->emu_mult, k, &tam, &error); + + if (leido == NULL) { + PERR("LEI CUALQUIER COSA, BUG?"); + return 1; + } + + cant = *((int *)leido); + + /* Obtengo un nuevo lugar para el dato nuevo */ + array = (INDICE_DATO *)(leido+sizeof(int)); + + /* busco pos de dato en array */ + for(pos=0; posemu_mult->borrar_registro(idx->emu_mult, k, dummy1); + return 0; + } + + /* Quito el elemento */ + leido = realloc(leido, sizeof(int)+cant*sizeof(INDICE_DATO)); + + /* Actualizo la cantidad */ + (*((int *)leido)) = cant; + + error = 0; + idx->emu_mult->modificar_registro(idx->emu_mult, + k, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error, + dummy1 + ); + + free(leido); + + return cant; +} + +#ifdef NO_TERMINAOD +EMUFS_Estadisticas emufs_indice_b_obtener_estadisticas(INDICE *idx) +{ + EMUFS_Estadisticas stats, st_string, st_multiples; + + stats.tam_archivo = emufs_common_get_file_size(idx->filename); + stats.cant_bloques = stats.tam_archivo/idx->tam_bloque; + +} +#endif + +#include "indice_b_asc.c"