X-Git-Url: https://git.llucax.com/z.facultad/75.06/emufs.git/blobdiff_plain/0213eecd485623b3f5def829c4b16acaf4baad2e..78ff3129342b5ae75673aac710820805fe5e3f41:/emufs/indice_b.c?ds=inline diff --git a/emufs/indice_b.c b/emufs/indice_b.c index 96ada55..df09618 100644 --- a/emufs/indice_b.c +++ b/emufs/indice_b.c @@ -1,6 +1,7 @@ #include "indice_b.h" #include "common.h" +#include "emufs.h" /* Cantidad de claves por nodo */ #define CANT_HIJOS(x) ((x->tam_bloque-sizeof(B_NodoHeader))/sizeof(B_NodoEntry)) @@ -8,16 +9,55 @@ #define MIN_HIJOS(x) (CANT_HIJOS(x)/2) /* Auxiliares */ +/** Graba el nodo en el archivo */ static void b_grabar_nodo(INDICE *idx, int id, char *data); +/** Da el ID del proximo nodo a poder ser utilizado */ static int b_ultimo_id(INDICE *idx); +/** Lee un nodo desde el archivo */ static char *b_leer_nodo(INDICE *idx, int id); +/** Crea un nodo en el archivo y lo retorna. En i se pone el ID asignado */ static char *b_crear_nodo(INDICE *idx, int *i); +/** Lee el header de un nodo y lo guarda en header */ static void b_leer_header(char *src, B_NodoHeader *header); +/** Actualiza el header de un nodo desde header */ static void b_actualizar_header(char *src, B_NodoHeader *header); +/** Retorna el array de claves del nodo (esta data modifica directamente el bloque + * por eso no es necesario usar un actualizar_claves + */ static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header); +/** Inserta una clave en el nodo de manera iterativa. + * \param idx Índice en donde insertar la clave. + * \param clave Clave a insertar. + * \param dato Dato a insertar + * \param nodo_id Id del nodo en el cual insertar la nueva clave. + * \param nodo FIXME Nodo en donde insertar??? No entiendo por que char*. + * \param hijo1 Id del nodo hijo de la izquierda del insertado. + * \param hijo2 Id del nodo hijo de la derecha del insertado. + */ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2); +/** Inserta en un nodo en el que se sabe positivamente que hay lugar. */ +static void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2); +/** Esto es para asegurar el orden de los hijos luego de partir, en el caso de que + * lo que se parta sea la raiz + */ static int b_elegir_izquierdo(INDICE *idx, int a, int b); +/** Borra una clave del arbol */ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k); +/** Le pide al hermano derecho del nodo una clave cuando se eliminan claves */ +static void b_pedir_clave_derecha(char *, int, char *, int, char *, int, int); +/** Le pide al hermano izquierdo una clave cuando se eliminan claves */ +static void b_pedir_clave_izquierda(char *, int, char *, int, char *, int, int); +/** Le pasa al hermano derecho del nodo una clave cuando se insertan claves */ +static void b_pasar_clave_a_derecha(INDICE*, char*, int, char*, int, int, B_NodoEntry); +/** Le pasa al hermano izquierdo una clave cuando se insertan claves */ +static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_NodoEntry); +/** Junta 2 nodos y hace uno solo */ +static void b_fundir_nodo(char *, int, char *, int, char *, int, int); + +static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo); + +static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); +static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); void emufs_indice_b_crear(INDICE *idx) { @@ -54,6 +94,7 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) B_NodoHeader header; B_NodoEntry *claves; char *nodo, *padre; + INDICE_DATO dummy; /* Leo la raiz */ nodo = b_leer_nodo(idx, 0); @@ -68,8 +109,21 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) i=0; while ((ifuncion == IND_PRIMARIO) { + PERR("Indice primario no puede contener claves duplicadas!"); + PERR(idx->nombre); + return 0; + } + + /* TODO : Implementar carga de valor en clave duplicada! */ + b_insertar_dup_en_pos(idx, claves[i].dato, dato); + + if (idx->tipo_dato == IDX_STRING) { + /* Tengo que sacar el texto repetido del archivo de textos */ + PERR("Eliminando string duplicado"); + idx->emu_string->borrar_registro(idx->emu_string, clave); + } + return 1; } else { if (i == 0) { nodo = b_leer_nodo(idx, header.hijo_izquierdo); @@ -84,6 +138,19 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) if (nodo) free(nodo); nodo = padre; nodo_id = padre_id; + + if (idx->funcion != IND_PRIMARIO) { + /* Agrego el DATO real al archivo de claves repetiras + * y me guardo el ID para poner en el indice + */ + dummy.id = -1; + dato.id = b_insertar_dup_en_pos(idx, dummy, dato); + if (dato.id != -1) + PERR("NODO INSERTADO EN POS GENERADA NUEVA"); + PERR("Ahora inserto"); + fprintf(stderr, "Nombre del coso = %s\n", idx->nombre); + } + b_insertar_en_nodo(idx, clave, dato, nodo_id, nodo, -1, -1); return 1; /* Agregar OK! */ } @@ -103,7 +170,7 @@ INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave) claves = b_leer_claves(nodo, &header); i=0; while ((itipo_dato == IDX_STRING) { + b_leer_header(out, &header); + claves = b_leer_claves(out, &header); + desabreviar_claves(idx, claves, &header); + } fclose(fp); return out; } @@ -232,24 +307,15 @@ static char *b_leer_nodo(INDICE *idx, int id) static void b_grabar_nodo(INDICE *idx, int id, char *data) { FILE *fp; + B_NodoHeader header; + B_NodoEntry *claves; -/* if (id > b_ultimo_id()) { - printf("AGREGANDO AL FINAL\n"); - fp = fopen(FILENAME, "a"); - if (fp == NULL) { - _("No se pudo abrir archivo\n"); - return; - } - } else { - fp = fopen(FILENAME, "w"); - if (fp == NULL) { - _("No se pudo abrir archivo\n"); - return; - } - fseek(fp, id*BLOCK_SIZE, SEEK_SET); - printf("SOLO GUARDO DATA\n"); - }*/ - + /* Si las claves son de tipo string debo abreviar antes de guardar */ + if (idx->tipo_dato == IDX_STRING) { + b_leer_header(data, &header); + claves = b_leer_claves(data, &header); + abreviar_claves(idx, claves, &header); + } fp = fopen(idx->filename, "r+"); fseek(fp, id*idx->tam_bloque, SEEK_SET); fwrite(data, 1, idx->tam_bloque, fp); @@ -296,6 +362,12 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n if (nodo_header.cant == CANT_HIJOS(idx)) { int total; + /* TODO: Si es B*, hay que chequear si alguno de los 2 + * nodos hermanos pueden prestarme espacio (y + * desplazar si es así). Si no pueden, hay que + * hacer un split de 2 nodos en 3. + * Si no es B*, hay que hacer lo que sigue: + */ nuevo = b_crear_nodo(idx, &nuevo_id); i=0; /* Creo una lista ordenada de los nodos a partir */ @@ -308,7 +380,8 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n tmp_claves[i].clave = clave; tmp_claves[i].dato = dato; tmp_claves[i].hijo_derecho = hijo1; - tmp_claves[i+1].hijo_derecho = hijo2; + if (i 0) { - while ((emufs_indice_es_menor(idx, claves[i].clave, clave)) && (i < nodo_header.cant)) i++; - for(j=nodo_header.cant; j > i; j--) - claves[j] = claves[j-1]; - } - nodo_header.cant++; - claves[i].clave = clave; - claves[i].dato = dato; - claves[i].hijo_derecho = hijo2; - nodo_header.hijo_izquierdo = b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1); - - b_actualizar_header(nodo, &nodo_header); - b_grabar_nodo(idx, nodo_id, nodo); - - /* Debo actualizar los punteros al padre de los hijos */ - if (hijo1 != -1) { - nuevo = b_leer_nodo(idx, hijo1); - if (nuevo != NULL) { - b_leer_header(nuevo, &nuevo_header); - nuevo_header.padre = nodo_id; - b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(idx, hijo1, nuevo); - free(nuevo); - } else printf("FUCK! hijo1=%d no existe!\n", hijo1); - } - if (hijo2 != -1) { - nuevo = b_leer_nodo(idx, hijo2); - if (nuevo != NULL) { - b_leer_header(nuevo, &nuevo_header); - nuevo_header.padre = nodo_id; - b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(idx, hijo2, nuevo); - free(nuevo); - } else printf("FUCK! hijo2=%d no existe!\n", hijo2); - } + b_insertar_en_nodo_con_lugar(idx, clave, dato, nodo_id, nodo, hijo1, hijo2); salir = 1; } } while (!salir); } +void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2) +{ + int i = 0; + B_NodoHeader nodo_header; + B_NodoEntry* claves; + b_leer_header(nodo, &nodo_header); + claves = b_leer_claves(nodo, &nodo_header); + if (nodo_header.cant > 0) { + int j; + while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++; + for(j=nodo_header.cant; j > i; j--) + claves[j] = claves[j-1]; + } + nodo_header.cant++; + claves[i].clave = clave; + claves[i].dato = dato; + claves[i].hijo_derecho = hijo2; + nodo_header.hijo_izquierdo = b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1); + + b_actualizar_header(nodo, &nodo_header); + b_grabar_nodo(idx, nodo_id, nodo); + + /* Debo actualizar los punteros al padre de los hijos */ + if (hijo1 != -1) { + char* nuevo = b_leer_nodo(idx, hijo1); + if (nuevo != NULL) { + B_NodoHeader nuevo_header; + b_leer_header(nuevo, &nuevo_header); + nuevo_header.padre = nodo_id; + b_actualizar_header(nuevo, &nuevo_header); + b_grabar_nodo(idx, hijo1, nuevo); + free(nuevo); + } else printf("FUCK! hijo1=%d no existe!\n", hijo1); + } + if (hijo2 != -1) { + char* nuevo = b_leer_nodo(idx, hijo2); + if (nuevo != NULL) { + B_NodoHeader nuevo_header; + b_leer_header(nuevo, &nuevo_header); + nuevo_header.padre = nodo_id; + b_actualizar_header(nuevo, &nuevo_header); + b_grabar_nodo(idx, hijo2, nuevo); + free(nuevo); + } else printf("FUCK! hijo2=%d no existe!\n", hijo2); + } +} + static int b_elegir_izquierdo(INDICE *idx, int a, int b) { int cual; @@ -459,22 +544,50 @@ static int b_elegir_izquierdo(INDICE *idx, int a, int b) INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant) { + EMUFS_REG_SIZE tam; + int error=0; + char *leido; + CLAVE k; + INDICE_DATO dato, *ret; + /* Si el indice es primario no tiene sentido hacer nada */ if (idx->funcion == IND_PRIMARIO) { *cant = 0; + PERR("INDICE PRIMARIO NO SOPORTA BUSQUEDA MULTIPLE"); return NULL; } - /* TODO Implementar indices con repeticion */ - return NULL; + /* Busco la clave en el arbol */ + dato = emufs_indice_b_buscar(idx, clave); + + if (dato.id == -1) { + PERR("CLAvE NO ENCONTRADA EN EL ARBOL!"); + } + + /* Leo el contenido actual */ + k.i_clave = dato.id; + error = 0; + leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error); + + /* Incremento en 1 la cantidad */ + if (leido != NULL) + (*cant) = *((int *)leido); + else + (*cant) = 0; + + ret = malloc(sizeof(INDICE_DATO)*(*cant)); + memcpy(ret, leido+sizeof(int), (*cant)*sizeof(INDICE_DATO)); + free(leido); + fprintf(stderr, "TENGO QUE ESTA CLAVE TIENE %d ITEMS\n", *cant); + return ret; } static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) { - int pos, actual_id, i; - B_NodoHeader header, header_actual; - B_NodoEntry *claves, *claves_actual; - char *actual; + int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id; + B_NodoHeader header, header_actual, header_padre, header_izq, header_der; + B_NodoEntry *claves, *claves_actual, *claves_padre;/*, *claves_izq, *claves_der;*/ + char *actual, *padre, *izq, *der; b_leer_header(nodo, &header); claves = b_leer_claves(nodo, &header); @@ -523,6 +636,306 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) } /* Tengo que pasar datos o fundir nodos :-( */ - PERR("TODO : FUNDIR NODOS!!!!\n"); + do { + padre_id = header.padre; + padre = b_leer_nodo(idx, padre_id); + b_leer_header(padre, &header_padre); + claves_padre = b_leer_claves(padre, &header_padre); + /* TODO Tengo el hijo_izquierdo para revisar!! XXX */ + if (header_padre.hijo_izquierdo == actual_id) { + izquierda_id = -1; /* No tengo hermano izquierdo */ + /* Mi hermano derecho es el primer nodo del padre */ + derecha_id = claves_padre[0].hijo_derecho; + der = b_leer_nodo(idx, derecha_id); + b_leer_header(der, &header_der); + } else { + for(pos_padre=0; claves_padre[pos_padre].hijo_derecho != actual_id; pos_padre++) { } + + /* Busco mis hermanos a derecha e izquierda, si es que existen */ + if (pos_padre >= 0) { + if (pos_padre == 0) + izquierda_id = header_padre.hijo_izquierdo; + else + izquierda_id = claves_padre[pos_padre-1].hijo_derecho; + izq = b_leer_nodo(idx, izquierda_id); + b_leer_header(izq, &header_izq); + } else { + izquierda_id = -1; + } + if (pos_padre < header_padre.cant) { + derecha_id = claves_padre[pos_padre+1].hijo_derecho; + der = b_leer_nodo(idx, derecha_id); + b_leer_header(der, &header_der); + } else { + derecha_id = -1; + } + } + /* Intendo pasar una clave desde un hermano hacia mi */ + if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) { + b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre); + } else if ((izquierda_id != -1) && (header_izq.cant > MIN_HIJOS(idx))) { + b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1); + } else { + /* No pude pasar clave, tengo que fundir :-( */ + if (derecha_id != -1) { + b_fundir_nodo(actual, actual_id, padre, padre_id, der, derecha_id, pos_padre); + } else { + b_fundir_nodo(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1); + } + } + + /* TODO que guardo ?, todo ? */ + b_grabar_nodo(idx, actual_id, actual); + b_grabar_nodo(idx, izquierda_id, izq); + b_grabar_nodo(idx, derecha_id, der); + b_grabar_nodo(idx, padre_id, padre); + if (actual_id != -1) free(actual); + /*if (padre_id != -1) free(padre);*/ + if (derecha_id != -1) free(der); + if (izquierda_id != -1) free(izq); + actual = padre; + actual_id = padre_id; + } while ((actual_id != -1) && (header_actual.cant < MIN_HIJOS(idx))); +} + +static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave) +{ + int i; + B_NodoHeader h_der, h_padre, h_nodo; + B_NodoEntry *c_der, *c_padre, *c_nodo; + + b_leer_header(nodo, &h_nodo); + c_nodo = b_leer_claves(nodo, &h_nodo); + b_leer_header(der, &h_der); + c_der = b_leer_claves(der, &h_der); + b_leer_header(padre, &h_padre); + c_padre = b_leer_claves(padre, &h_padre); + + c_nodo[h_nodo.cant] = c_padre[pos_clave]; + c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */ + + c_padre[pos_clave] = c_der[0]; + c_padre[pos_clave].hijo_derecho = der_id; + + /* Muevo las claves de derecho */ + for(i=0; i0;i++) + c_nodo[i] = c_nodo[i-1]; + + h_nodo.cant++; + c_nodo[0] = c_padre[pos_clave]; + c_nodo[0].hijo_derecho = -1; /* XXX */ + c_padre[pos_clave] = c_izq[h_izq.cant-1]; + c_padre[pos_clave].hijo_derecho = izq_id; + h_izq.cant--; + + b_actualizar_header(izq, &h_izq); + b_actualizar_header(padre, &h_padre); + b_actualizar_header(nodo, &h_nodo); +} + +void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry) +{ +/* int i; + B_NodoHeader h_izq, h_padre, h_nodo; + B_NodoEntry *c_izq, *c_padre, *c_nodo; + + b_leer_header(nodo, &h_nodo); + c_nodo = b_leer_claves(nodo, &h_nodo); + b_leer_header(izq, &h_izq); + c_izq = b_leer_claves(izq, &h_izq); + b_leer_header(padre, &h_padre); + c_padre = b_leer_claves(padre, &h_padre); + + for(i=h_nodo.cant; i>0;i++) + c_nodo[i] = c_nodo[i-1]; + + h_nodo.cant++; + c_nodo[0] = c_padre[pos_clave]; + c_nodo[0].hijo_derecho = -1; / * XXX * / + c_padre[pos_clave] = c_izq[h_izq.cant-1]; + c_padre[pos_clave].hijo_derecho = izq_id; + h_izq.cant--; + + b_actualizar_header(izq, &h_izq); + b_actualizar_header(padre, &h_padre); + b_actualizar_header(nodo, &h_nodo); +*/ +} + +static void b_fundir_nodo(char *izq, int izq_id, char *padre, int padre_id, char *der, int der_id, int pos_clave) +{ +} + +static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo) +{ + int cant; + EMUFS_REG_SIZE tam; + int error=0; + INDICE_DATO *array; + char *leido; + CLAVE k; + + /* Leo el contenido actual */ + k.i_clave = pos.id; + error = 0; + leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error); + + /* Incremento en 1 la cantidad */ + if (leido != NULL) + cant = *((int *)leido); + else + cant = 0; + cant++; + + /* Obtengo un nuevo lugar para el dato nuevo */ + /* Aca todo bien, si leido es NULL se compota como malloc */ + leido = realloc(leido, cant*sizeof(INDICE_DATO)+sizeof(int)); + array = (INDICE_DATO *)(leido+sizeof(int)); + + /* Pongo el dato nuevo */ + array[cant-1] = nuevo; + + /* Actualizo la cantidad */ + (*((int *)leido)) = cant; + + /* Salvo */ + if (k.i_clave == -1) { + /* Creo uno nuevo */ + error = 0; + PERR("GRABADO REGISTRO NUEVO"); + k.i_clave = idx->emu_mult->grabar_registro(idx->emu_mult, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error + ); + if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!"); + } else { + /* Modifico el que ya existia! */ + PERR("MODIFICANDO REGISTRO EXISTENTE"); + error = 0; + idx->emu_mult->modificar_registro(idx->emu_mult, + k.i_clave, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error + ); + } + /* Clean up! */ + free(leido); + return k.i_clave; +} + +char *abreviar(char *primera, char *actual, int *iguales) +{ + (*iguales) = 0; + while (((*primera) != '\0') && ((*actual) != '\0')) { + if ((*primera) == (*actual)) { + primera++; + actual++; + (*iguales)++; + } else { + /* No coinciden mas! */ + break; + } + } + + return actual; +} + +static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header) +{ + char *primera, *actual, *resto, salvar[100]; + EMUFS_REG_SIZE size; + int error, i; + int iguales; + + /* Agarro la primer clave entera como referencia */ + primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error); + for(i=1; icant; i++) { + actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error); + resto = abreviar(primera, actual, &iguales); + /* Para que tenga sentido abreviar tengo que tener + * mas de 2 letras iguales, si no no gano nada y complica las cosas + */ + if (iguales > 1) { + sprintf(salvar, "%d|%s", iguales, resto); + free(actual); + error = 0; + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave.i_clave, salvar, strlen(salvar)+1, &error); + } else { + free(primera); + primera = actual; + } + } + + free(primera); +} + +static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header) +{ + char *primera, *actual, *resto, salvar[100]; + EMUFS_REG_SIZE size; + int error, i; + int iguales; + + /* Agarro la primer clave entera como referencia */ + primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error); + for(i=1; icant; i++) { + actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error); + iguales = strtol(actual, &resto, 10); + if ((iguales > 0) && (*resto == '|')) { + fprintf(stderr, "%s %s %d\n", primera, actual, iguales); + strncpy(salvar, primera, iguales); + salvar[iguales] = '\0'; + strcat(salvar, resto+1); /* +1 para saltar el separador */ + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave.i_clave, salvar, strlen(salvar)+1, &error); + free(actual); + } else { + free(primera); + primera = actual; + } + } + + free(primera); }