X-Git-Url: https://git.llucax.com/z.facultad/75.06/emufs.git/blobdiff_plain/d0fc22a6828f9799a0869e2fc1a5360772ad5ce0..a680ab304d20541f4bf03709354b7b7c2ffdf993:/emufs/indice_b.c?ds=sidebyside diff --git a/emufs/indice_b.c b/emufs/indice_b.c index a3027d3..e6a0e05 100644 --- a/emufs/indice_b.c +++ b/emufs/indice_b.c @@ -2,6 +2,7 @@ #include "indice_b.h" #include "common.h" #include "emufs.h" +#include "form.h" /* Cantidad de claves por nodo */ #define CANT_HIJOS(x) ((x->tam_bloque-sizeof(B_NodoHeader))/sizeof(B_NodoEntry)) @@ -13,18 +14,10 @@ static void b_grabar_nodo(INDICE *idx, int id, char *data); /** Da el ID del proximo nodo a poder ser utilizado */ static int b_ultimo_id(INDICE *idx); -/** Lee un nodo desde el archivo */ -static char *b_leer_nodo(INDICE *idx, int id); /** Crea un nodo en el archivo y lo retorna. En i se pone el ID asignado */ static char *b_crear_nodo(INDICE *idx, int *i); -/** Lee el header de un nodo y lo guarda en header */ -static void b_leer_header(char *src, B_NodoHeader *header); /** Actualiza el header de un nodo desde header */ static void b_actualizar_header(char *src, B_NodoHeader *header); -/** Retorna el array de claves del nodo (esta data modifica directamente el bloque - * por eso no es necesario usar un actualizar_claves - */ -static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header); /** Inserta una clave en el nodo de manera iterativa. * \param idx Índice en donde insertar la clave. * \param clave Clave a insertar. @@ -34,13 +27,9 @@ static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header); * \param hijo1 Id del nodo hijo de la izquierda del insertado. * \param hijo2 Id del nodo hijo de la derecha del insertado. */ -static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2); +static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der); /** Inserta en un nodo en el que se sabe positivamente que hay lugar. */ -static void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2); -/** Esto es para asegurar el orden de los hijos luego de partir, en el caso de que - * lo que se parta sea la raiz - */ -static int b_elegir_izquierdo(INDICE *idx, int a, int b); +static void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der); /** Borra una clave del arbol */ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k); /** Le pide al hermano derecho del nodo una clave cuando se eliminan claves */ @@ -50,11 +39,17 @@ static void b_pedir_clave_izquierda(char *, int, char *, int, char *, int, int); /** Le pasa al hermano derecho del nodo una clave cuando se insertan claves */ static void b_pasar_clave_a_derecha(INDICE*, char*, int, char*, int, int, B_NodoEntry); /** Le pasa al hermano izquierdo una clave cuando se insertan claves */ -static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_NodoEntry); +static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_NodoEntry, int, int); /** Junta 2 nodos y hace uno solo */ -static void b_fundir_nodo(char *, int, char *, int, char *, int, int); +static void b_fundir_nodo(INDICE *,char *, int, char *, int, char *, int, int); +/** Crea 3 nodos a partir de 2 llenos */ +static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre); -static void b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo); +static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo); + +static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); +static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); +int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k, INDICE_DATO dato); void emufs_indice_b_crear(INDICE *idx) { @@ -68,8 +63,6 @@ void emufs_indice_b_crear(INDICE *idx) header.hijo_izquierdo = -1; fp = fopen(idx->filename, "w"); - PERR("Creando indice"); - fprintf(stderr, "Archivo = (%s)\n", idx->filename); if (fp == NULL) { PERR("Error al crear el archivo"); return; @@ -82,6 +75,7 @@ void emufs_indice_b_crear(INDICE *idx) memcpy(bloque, &header, sizeof(B_NodoHeader)); fwrite(bloque, idx->tam_bloque, 1, fp); + free(bloque); fclose(fp); } @@ -91,6 +85,7 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) B_NodoHeader header; B_NodoEntry *claves; char *nodo, *padre; + INDICE_DATO dummy; /* Leo la raiz */ nodo = b_leer_nodo(idx, 0); @@ -105,14 +100,19 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) i=0; while ((itipo == IND_PRIMARIO) { + if (idx->funcion == IND_PRIMARIO) { PERR("Indice primario no puede contener claves duplicadas!"); + PERR(idx->nombre); return 0; } - - /* TODO : Implementar carga de valor en clave duplicada! */ - b_insertar_dup_en_pos(idx, claves[i].dato, dato); - + + if ((idx->funcion == IND_SELECCION) && (!emufs_indice_es_clave_nula(idx, clave))) + b_insertar_dup_en_pos(idx, claves[i].dato, dato); + + if (idx->tipo_dato == IDX_STRING) { + /* Tengo que sacar el texto repetido del archivo de textos */ + idx->emu_string->borrar_registro(idx->emu_string, clave, dummy); + } return 1; } else { if (i == 0) { @@ -128,6 +128,20 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) if (nodo) free(nodo); nodo = padre; nodo_id = padre_id; + + if (idx->funcion != IND_PRIMARIO) { + /* Agrego el DATO real al archivo de claves repetiras + * y me guardo el ID para poner en el indice + */ + if ((idx->funcion == IND_SELECCION) && (emufs_indice_es_clave_nula(idx, clave))) + /* UPS!, la clave que se va a insertar por primera vez es nula + * y soy un indice selectivo!, no lo puedo permitir, ciao!! + */ + return 1; + dummy.id = -1; + dato.id = b_insertar_dup_en_pos(idx, dummy, dato); + } + b_insertar_en_nodo(idx, clave, dato, nodo_id, nodo, -1, -1); return 1; /* Agregar OK! */ } @@ -139,30 +153,30 @@ INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave) B_NodoHeader header; B_NodoEntry *claves; char *nodo, *tmp; - - if (idx->tipo != IND_PRIMARIO) { - /* SOLO SE PUEDE BUSCAR CON CLAVE UNICA! */ - ret.id = ret.bloque = -1; - return ret; - } + int nodo_id; /* Leo la raiz */ nodo = b_leer_nodo(idx, 0); + nodo_id = 0; while (nodo) { b_leer_header(nodo, &header); claves = b_leer_claves(nodo, &header); i=0; while ((inombre, nodo_id); + if (idx->funcion != IND_PRIMARIO) { + /* Debo borrar primero la clave desde el archivo de + * claves repetidas, y si recien ahi me quedo sin claves, + * borrar la clave del arbol + */ + PERR("Vamos a borrar duplicados"); + encontrado = b_borrar_dup_clave(idx, claves[i].dato, dato); + fprintf(stderr, "Listo, encontrado = %d\n", encontrado); + } + if (encontrado) { + b_borrar_clave(idx, nodo, nodo_id, k); + } } else { PERR("Clave no encontrada"); } @@ -250,10 +275,12 @@ static char *b_crear_nodo(INDICE *idx, int *id) return bloque; } -static char *b_leer_nodo(INDICE *idx, int id) +char *b_leer_nodo(INDICE *idx, int id) { FILE *fp; char *out; + /*B_NodoHeader header; + B_NodoEntry *claves;*/ if (id < 0) return NULL; @@ -275,6 +302,12 @@ static char *b_leer_nodo(INDICE *idx, int id) return NULL; } + /* Si estoy manejando string tengo que sacar las abreviaturas */ +/* if (idx->tipo_dato == IDX_STRING) { + b_leer_header(out, &header); + claves = b_leer_claves(out, &header); + desabreviar_claves(idx, claves, &header); + }*/ fclose(fp); return out; } @@ -282,31 +315,22 @@ static char *b_leer_nodo(INDICE *idx, int id) static void b_grabar_nodo(INDICE *idx, int id, char *data) { FILE *fp; - -/* if (id > b_ultimo_id()) { - printf("AGREGANDO AL FINAL\n"); - fp = fopen(FILENAME, "a"); - if (fp == NULL) { - _("No se pudo abrir archivo\n"); - return; - } - } else { - fp = fopen(FILENAME, "w"); - if (fp == NULL) { - _("No se pudo abrir archivo\n"); - return; - } - fseek(fp, id*BLOCK_SIZE, SEEK_SET); - printf("SOLO GUARDO DATA\n"); + /*B_NodoHeader header; + B_NodoEntry *claves;*/ + + /* Si las claves son de tipo string debo abreviar antes de guardar */ +/* if (idx->tipo_dato == IDX_STRING) { + b_leer_header(data, &header); + claves = b_leer_claves(data, &header); + abreviar_claves(idx, claves, &header); }*/ - fp = fopen(idx->filename, "r+"); fseek(fp, id*idx->tam_bloque, SEEK_SET); fwrite(data, 1, idx->tam_bloque, fp); fclose(fp); } -static void b_leer_header(char *src, B_NodoHeader *header) +void b_leer_header(char *src, B_NodoHeader *header) { if (!src) return; @@ -319,7 +343,7 @@ static void b_actualizar_header(char *src, B_NodoHeader *header) memcpy(src, header, sizeof(B_NodoHeader)); } -static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header) +B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header) { return (B_NodoEntry *)(src+sizeof(B_NodoHeader)); } @@ -346,25 +370,72 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n if (nodo_header.cant == CANT_HIJOS(idx)) { int total; - /* TODO: Si es B*, hay que chequear si alguno de los 2 - * nodos hermanos pueden prestarme espacio (y - * desplazar si es así). Si no pueden, hay que - * hacer un split de 2 nodos en 3. - * Si no es B*, hay que hacer lo que sigue: + /* + * TODO FIXME XXX TODO FIXME XXX TODO FIXME XXX + * + ******************************************************* + * Pseudocódigo que explica que hay que hacer si es B* + * + * OJO! Si el nodo en el cual estoy insertando es el + * raíz, se maneja exactamente igual que en el B común, + * así que el if sería algo como: + * if (idx->tipo == IND_B_ASC && !es_raiz(nodo_id)) + ******************************************************* + * + * nuevo_entry = new entry(clave, dato, hijo_der) + * padre = get_padre(nodo) + * + * // Veo si puedo pasar a derecha + * hijo_derecho = get_hijo_derecho(padre) + * if (hijo_derecho != NULL && hijo_derecho.cantidad_entries < MAX_ENTRIES) + * buffer = new entries[MAX_ENTRIES+1] + * copiar_entries(buffer, nodo) + * insertar_ordenado(buffer, nuevo_entry) + * entry_a_pasar = get_entry_extremo_derecho(buffer) + * b_pasar_clave_a_derecha(idx, hijo_derecho, hijo_derecho.id, padre, padre.id, padre.posicion, entry_a_pasar) + * SALIR + * + * // Veo si puedo pasar a izquierda + * hijo_izquierdo = get_hijo_izquierdo(padre) + * if (hijo_izquierdo != NULL && hijo_izquierdo.cantidad_entries < MAX_ENTRIES) + * buffer = new entries[MAX_ENTRIES+1] + * copiar_entries(buffer, nodo) + * insertar_ordenado(buffer, nuevo_entry) + * entry_a_pasar = get_entry_extremo_izquierdo(buffer) + * b_pasar_clave_a_izquierda(idx, hijo_izquierdo, hijo_izquierdo.id, padre, padre.id, padre.posicion, entry_a_pasar) + * SALIR + * + * // Parto 2 nodos en 3. + * if (hijo_izquierdo != NULL) + * b_partir_dos_nodos_en_tres(idx, hijo_izquierdo, nodo, padre, nuevo_entry) + * else // Siempre alguno tiene que existir. + * b_partir_dos_nodos_en_tres(idx, nodo, hijo_derecho, padre, nuevo_entry) + * + * SALIR + * + ********************************************************************************** + * Fin de pseudocódigo, si no es B* se sigue haciendo lo que dice a continuación. * + ********************************************************************************** */ nuevo = b_crear_nodo(idx, &nuevo_id); i=0; /* Creo una lista ordenada de los nodos a partir */ tmp_claves = (B_NodoEntry *)malloc(sizeof(B_NodoEntry)*(nodo_header.cant+1)); - total = nodo_header.cant; + total = nodo_header.cant+1; while ((itam_bloque-sizeof(B_NodoHeader)); for(j=0; jtam_bloque); b_actualizar_header(nuevo, &nuevo_header); b_grabar_nodo(idx, 0, nuevo); @@ -449,7 +524,7 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n } while (!salir); } -void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2) +void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_izq, int hijo_der) { int i = 0; B_NodoHeader nodo_header; @@ -458,106 +533,148 @@ void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, in claves = b_leer_claves(nodo, &nodo_header); if (nodo_header.cant > 0) { int j; - while ((emufs_indice_es_menor(idx, claves[i].clave, clave)) && (i < nodo_header.cant)) i++; + while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++; for(j=nodo_header.cant; j > i; j--) claves[j] = claves[j-1]; } nodo_header.cant++; claves[i].clave = clave; claves[i].dato = dato; - claves[i].hijo_derecho = hijo2; - nodo_header.hijo_izquierdo = b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1); + if (i==0) { + nodo_header.hijo_izquierdo = hijo_izq; + claves[i].hijo_derecho = hijo_der; + } else { + claves[i-1].hijo_derecho = hijo_izq; + claves[i].hijo_derecho = hijo_der; + } b_actualizar_header(nodo, &nodo_header); b_grabar_nodo(idx, nodo_id, nodo); /* Debo actualizar los punteros al padre de los hijos */ - if (hijo1 != -1) { - char* nuevo = b_leer_nodo(idx, hijo1); + if (hijo_izq != -1) { + char* nuevo = b_leer_nodo(idx, hijo_izq); if (nuevo != NULL) { B_NodoHeader nuevo_header; + fprintf(stderr, "Actualizo padre de %d a %d\n", hijo_izq, nodo_id); b_leer_header(nuevo, &nuevo_header); nuevo_header.padre = nodo_id; b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(idx, hijo1, nuevo); + b_grabar_nodo(idx, hijo_izq, nuevo); free(nuevo); - } else printf("FUCK! hijo1=%d no existe!\n", hijo1); + } else printf("FUCK! hijo_izq=%d no existe!\n", hijo_izq); } - if (hijo2 != -1) { - char* nuevo = b_leer_nodo(idx, hijo2); + if (hijo_der != -1) { + char* nuevo = b_leer_nodo(idx, hijo_der); if (nuevo != NULL) { B_NodoHeader nuevo_header; + fprintf(stderr, "Actualizo padre de %d a %d\n", hijo_der, nodo_id); b_leer_header(nuevo, &nuevo_header); nuevo_header.padre = nodo_id; b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(idx, hijo2, nuevo); + b_grabar_nodo(idx, hijo_der, nuevo); free(nuevo); - } else printf("FUCK! hijo2=%d no existe!\n", hijo2); + } else printf("FUCK! hijo_der=%d no existe!\n", hijo_der); } } -static int b_elegir_izquierdo(INDICE *idx, int a, int b) +void b_insertar_en_nodo_con_lugar_sin_hijo_izq(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo_der) { - int cual; - char *nodo1, *nodo2; - B_NodoHeader header1, header2; - B_NodoEntry *claves1, *claves2; - - if (a==-1) return b; - if (b==-1) return a; - - nodo1 = b_leer_nodo(idx, a); - nodo2 = b_leer_nodo(idx, b); - - b_leer_header(nodo1, &header1); - b_leer_header(nodo2, &header2); - - claves1 = b_leer_claves(nodo1, &header1); - claves2 = b_leer_claves(nodo2, &header2); + int i = 0; + B_NodoHeader nodo_header; + B_NodoEntry* claves; + b_leer_header(nodo, &nodo_header); + claves = b_leer_claves(nodo, &nodo_header); + if (nodo_header.cant > 0) { + int j; + while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++; + for(j=nodo_header.cant; j > i; j--) + claves[j] = claves[j-1]; + } + nodo_header.cant++; + claves[i].clave = clave; + claves[i].dato = dato; + claves[i].hijo_derecho = hijo_der; - if (emufs_indice_es_menor(idx, claves1[0].clave, claves2[0].clave)) - cual = a; - else - cual = b; + b_actualizar_header(nodo, &nodo_header); + b_grabar_nodo(idx, nodo_id, nodo); - free(nodo1); - free(nodo2); - return cual; + /* Debo actualizar el puntero al padre del hijo */ + if (hijo_der != -1) { + char* nuevo = b_leer_nodo(idx, hijo_der); + if (nuevo != NULL) { + B_NodoHeader nuevo_header; + b_leer_header(nuevo, &nuevo_header); + nuevo_header.padre = nodo_id; + b_actualizar_header(nuevo, &nuevo_header); + b_grabar_nodo(idx, hijo_der, nuevo); + free(nuevo); + } else printf("FUCK! hijo_der=%d no existe!\n", hijo_der); + } } INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant) { + EMUFS_REG_SIZE tam; + int error=0; + char *leido; + CLAVE k; + INDICE_DATO dato, *ret; + /* Si el indice es primario no tiene sentido hacer nada */ if (idx->funcion == IND_PRIMARIO) { *cant = 0; + PERR("INDICE PRIMARIO NO SOPORTA BUSQUEDA MULTIPLE"); return NULL; } - /* TODO Implementar indices con repeticion */ - return NULL; + /* Busco la clave en el arbol */ + dato = emufs_indice_b_buscar(idx, clave); + + if (dato.id == -1) { + PERR("CLAvE NO ENCONTRADA EN EL ARBOL!"); + } + + /* Leo el contenido actual */ + k.i_clave = dato.id; + error = 0; + leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error); + + /* Incremento en 1 la cantidad */ + if (leido != NULL) + (*cant) = *((int *)leido); + else + (*cant) = 0; + + ret = malloc(sizeof(INDICE_DATO)*(*cant)); + memcpy(ret, leido+sizeof(int), (*cant)*sizeof(INDICE_DATO)); + free(leido); + return ret; } static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) { - int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id; + int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id, p; B_NodoHeader header, header_actual, header_padre, header_izq, header_der; B_NodoEntry *claves, *claves_actual, *claves_padre;/*, *claves_izq, *claves_der;*/ char *actual, *padre, *izq, *der; + PERR("Borrando clave"); b_leer_header(nodo, &header); claves = b_leer_claves(nodo, &header); pos = 0; /* Busco la posicion dentro de la lista de claves */ + PERR("Buscando lugar donde se encuentra la clave"); while (emufs_indice_es_menor(idx, claves[pos].clave, k)) pos++; /* Es el nodo una hoja? */ + fprintf(stderr, "La clave esta en la pos = %d\n", pos); if (header.hijo_izquierdo != -1) { - /* No!, es un nodo intermedio!! */ - if (pos == 0) - actual = b_leer_nodo(idx, header.hijo_izquierdo); - else - actual = b_leer_nodo(idx, claves[pos+1].hijo_derecho); + PERR("Nodo no es hoja, intercambio"); + actual = b_leer_nodo(idx, claves[pos].hijo_derecho); + actual_id = claves[pos].hijo_derecho; + p = claves[pos].hijo_derecho; b_leer_header(actual, &header_actual); while (header_actual.hijo_izquierdo != -1) { @@ -566,47 +683,68 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) actual = b_leer_nodo(idx, actual_id); b_leer_header(actual, &header_actual); } - claves_actual = b_leer_claves(actual, &header); + claves_actual = b_leer_claves(actual, &header_actual); claves[pos] = claves_actual[0]; + claves[pos].hijo_derecho = p; pos = 0; b_grabar_nodo(idx, nodo_id, nodo); + PERR("Listo"); } else { + PERR("Nodo es hoja"); actual = nodo; + header_actual = header; + claves_actual = claves; + actual_id = nodo_id; } /* Borro la clave */ - for(i=pos; i < header_actual.cant; i++) { + PERR("Borrando clave"); + for(i=pos; i < header_actual.cant-1; i++) { claves_actual[i] = claves_actual[i+1]; } + PERR("Borrado completo"); header_actual.cant--; /* Guardo los cambios */ b_actualizar_header(actual, &header_actual); b_grabar_nodo(idx, actual_id, actual); /* Se cumple la condicion de hijos? */ - if (header_actual.cant >= MIN_HIJOS(idx)) { + PERR("Dejo todo consistente"); + fprintf(stderr, "Condicion : %d >= %d\n", header_actual.cant, MIN_HIJOS(idx)); + if ((header_actual.cant >= MIN_HIJOS(idx)) || (actual_id == 0)) { PERR("Borrar completo sin fundir"); return; } + PERR("Node queda con menos hijos de los posibles!"); /* Tengo que pasar datos o fundir nodos :-( */ do { padre_id = header.padre; + if (padre_id == -1) continue; padre = b_leer_nodo(idx, padre_id); b_leer_header(padre, &header_padre); claves_padre = b_leer_claves(padre, &header_padre); + fprintf(stderr, "ID del padre = %d de nivel %d\n", padre_id, header_padre.nivel); /* TODO Tengo el hijo_izquierdo para revisar!! XXX */ if (header_padre.hijo_izquierdo == actual_id) { + PERR("Soy el hijo izquierdo de padre"); izquierda_id = -1; /* No tengo hermano izquierdo */ /* Mi hermano derecho es el primer nodo del padre */ derecha_id = claves_padre[0].hijo_derecho; der = b_leer_nodo(idx, derecha_id); b_leer_header(der, &header_der); + pos_padre = 0; } else { - for(pos_padre=0; claves_padre[pos_padre].hijo_derecho != actual_id; pos_padre++) { } + PERR("Buscando que hijo soy"); + for(pos_padre=0; (claves_padre[pos_padre].hijo_derecho != actual_id); pos_padre++) { } + + if (pos_padre == header_padre.cant) { + PERR("ERROR GRAVE. Padre no me contiene :-("); + } /* Busco mis hermanos a derecha e izquierda, si es que existen */ + PERR("Ya me encontre, busco a mis hermanos"); if (pos_padre >= 0) { if (pos_padre == 0) izquierda_id = header_padre.hijo_izquierdo; @@ -626,31 +764,48 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) } } /* Intendo pasar una clave desde un hermano hacia mi */ + PERR("Ta calcule lo que tengo que hacer"); if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) { + PERR("Le pido clave a derecha"); + fprintf(stderr, "ANTES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant); + fprintf(stderr, "PEDIR DERECHA DATOS : yo=%d, padre=%d, der=%d, pos_clave=%d\n", actual_id, padre_id, derecha_id, pos_padre); b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre); + PERR("listo"); + b_leer_header(der, &header_der); + b_leer_header(padre, &header_padre); + b_leer_header(actual, &header_actual); + fprintf(stderr, "DESPUES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant); } else if ((izquierda_id != -1) && (header_izq.cant > MIN_HIJOS(idx))) { - b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1); + PERR("Le pido clave a izquierda"); + b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre); + /* como se modificaron cosas, leo de nuevo los headers */ + b_leer_header(izq, &header_izq); + b_leer_header(padre, &header_padre); + b_leer_header(actual, &header_actual); + PERR("Listo"); } else { /* No pude pasar clave, tengo que fundir :-( */ + PERR("Fundo nodos!"); if (derecha_id != -1) { - b_fundir_nodo(actual, actual_id, padre, padre_id, der, derecha_id, pos_padre); + b_fundir_nodo(idx, actual, actual_id, padre, padre_id, der, derecha_id, pos_padre); } else { - b_fundir_nodo(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1); + b_fundir_nodo(idx, izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre); } } /* TODO que guardo ?, todo ? */ b_grabar_nodo(idx, actual_id, actual); - b_grabar_nodo(idx, izquierda_id, izq); - b_grabar_nodo(idx, derecha_id, der); - b_grabar_nodo(idx, padre_id, padre); + if (izquierda_id != -1) b_grabar_nodo(idx, izquierda_id, izq); + if (derecha_id != -1) b_grabar_nodo(idx, derecha_id, der); + if (padre_id != -1) b_grabar_nodo(idx, padre_id, padre); if (actual_id != -1) free(actual); - /*if (padre_id != -1) free(padre);*/ if (derecha_id != -1) free(der); if (izquierda_id != -1) free(izq); actual = padre; actual_id = padre_id; - } while ((actual_id != -1) && (header_actual.cant < MIN_HIJOS(idx))); + b_leer_header(actual, &header_actual); + claves_actual = b_leer_claves(actual, &header_actual); + } while ((actual_id != -1) && (actual_id != 0) && (header_actual.cant < MIN_HIJOS(idx))); } static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave) @@ -659,6 +814,7 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_ B_NodoHeader h_der, h_padre, h_nodo; B_NodoEntry *c_der, *c_padre, *c_nodo; + PERR("Derecha 1"); b_leer_header(nodo, &h_nodo); c_nodo = b_leer_claves(nodo, &h_nodo); b_leer_header(der, &h_der); @@ -666,14 +822,17 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_ b_leer_header(padre, &h_padre); c_padre = b_leer_claves(padre, &h_padre); - c_nodo[h_nodo.cant] = c_padre[pos_clave]; + PERR("Derecha 2"); + c_nodo[h_nodo.cant] = c_padre[pos_clave+1]; c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */ - c_padre[pos_clave] = c_der[0]; - c_padre[pos_clave].hijo_derecho = der_id; + PERR("Derecha 3"); + c_padre[pos_clave+1] = c_der[0]; + c_padre[pos_clave+1].hijo_derecho = der_id; /* Muevo las claves de derecho */ - for(i=0; i0;i++) + PERR("Muevo las claves"); + for(i=h_nodo.cant; i>0;i--) c_nodo[i] = c_nodo[i-1]; h_nodo.cant++; + PERR("Paso clave de padre a nodo"); c_nodo[0] = c_padre[pos_clave]; c_nodo[0].hijo_derecho = -1; /* XXX */ + PERR("Paso clave de izquierda a padre"); c_padre[pos_clave] = c_izq[h_izq.cant-1]; - c_padre[pos_clave].hijo_derecho = izq_id; + c_padre[pos_clave].hijo_derecho = nodo_id; h_izq.cant--; + PERR("ACTUALIZO") b_actualizar_header(izq, &h_izq); b_actualizar_header(padre, &h_padre); b_actualizar_header(nodo, &h_nodo); + PERR("Salgo"); } -void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry) +void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry, int id_entry_hijo_izq, int id_entry_nodo) { -/* int i; - B_NodoHeader h_izq, h_padre, h_nodo; - B_NodoEntry *c_izq, *c_padre, *c_nodo; + B_NodoHeader padre_h; + B_NodoEntry* padre_entries; + /* Leo claves y cabecera del nodo de la izquierda y del padre */ + b_leer_header(padre, &padre_h); + padre_entries = b_leer_claves(padre, &padre_h); + /* Inserto en el hijo izquirdo la clave del padre */ + b_insertar_en_nodo_con_lugar_sin_hijo_izq(idx, padre_entries[padre_pos].clave, padre_entries[padre_pos].dato, + izq_id, izq, id_entry_hijo_izq); + /* Reemplazo clave del padre por clave nueva */ + entry.hijo_derecho = id_entry_nodo; + padre_entries[padre_pos] = entry; +} - b_leer_header(nodo, &h_nodo); - c_nodo = b_leer_claves(nodo, &h_nodo); +static void b_fundir_nodo(INDICE *idx, char *izq, int izq_id, char *padre, int padre_id, char *der, int der_id, int pos_padre) +{ + int i; + B_NodoHeader h_izq, h_padre, h_der; + B_NodoEntry *c_izq, *c_padre, *c_der; + + b_leer_header(der, &h_der); + c_der = b_leer_claves(der, &h_der); b_leer_header(izq, &h_izq); c_izq = b_leer_claves(izq, &h_izq); b_leer_header(padre, &h_padre); c_padre = b_leer_claves(padre, &h_padre); - for(i=h_nodo.cant; i>0;i++) - c_nodo[i] = c_nodo[i-1]; - - h_nodo.cant++; - c_nodo[0] = c_padre[pos_clave]; - c_nodo[0].hijo_derecho = -1; / * XXX * / - c_padre[pos_clave] = c_izq[h_izq.cant-1]; - c_padre[pos_clave].hijo_derecho = izq_id; - h_izq.cant--; + c_izq[h_izq.cant] = c_padre[pos_padre]; + h_padre.cant--; + for(i=pos_padre; itam_bloque); + b_grabar_nodo(idx, der_id, der); } -static void b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo) +static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo) { int cant; EMUFS_REG_SIZE tam; - int error; + int error=0; INDICE_DATO *array; char *leido; CLAVE k; /* Leo el contenido actual */ k.i_clave = pos.id; + error = 0; leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error); /* Incremento en 1 la cantidad */ - cant = *((int *)leido); + if (leido != NULL) + cant = *((int *)leido); + else + cant = 0; cant++; /* Obtengo un nuevo lugar para el dato nuevo */ + /* Aca todo bien, si leido es NULL se compota como malloc */ leido = realloc(leido, cant*sizeof(INDICE_DATO)+sizeof(int)); array = (INDICE_DATO *)(leido+sizeof(int)); @@ -789,14 +972,450 @@ static void b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuev (*((int *)leido)) = cant; /* Salvo */ - idx->emu_mult->modificar_registro(idx->emu_mult, - pos.id, - leido, - cant*sizeof(INDICE_DATO)+sizeof(int), - &error - ); - + if (k.i_clave == -1) { + /* Creo uno nuevo */ + error = 0; + k.i_clave = idx->emu_mult->grabar_registro(idx->emu_mult, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error + ); + if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!"); + } else { + /* Modifico el que ya existia! */ + INDICE_DATO dummy; + error = 0; + idx->emu_mult->modificar_registro(idx->emu_mult, + k, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error, + dummy + ); + } /* Clean up! */ free(leido); + return k.i_clave; +} + +char *abreviar(char *primera, char *actual, int *iguales) +{ + (*iguales) = 0; + while (((*primera) != '\0') && ((*actual) != '\0')) { + if ((*primera) == (*actual)) { + primera++; + actual++; + (*iguales)++; + } else { + /* No coinciden mas! */ + break; + } + } + + return actual; +} + +static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header) +{ + char *primera, *actual, *resto, salvar[100]; + EMUFS_REG_SIZE size; + int error, i; + int iguales; + + /* Agarro la primer clave entera como referencia */ + primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error); + for(i=1; icant; i++) { + actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error); + if (*actual == '*') { + free(actual); + continue; + } + resto = abreviar(primera, actual, &iguales); + /* Para que tenga sentido abreviar tengo que tener + * mas de 2 letras iguales, si no no gano nada y complica las cosas + */ + if (iguales > 1) { + INDICE_DATO dummy1; + sprintf(salvar, "%d|%s", iguales, resto); + free(actual); + error = 0; + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy1); + } else { + free(primera); + primera = actual; + } + } + + free(primera); +} + +static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header) +{ + char *primera, *actual, *resto, salvar[100]; + EMUFS_REG_SIZE size; + int error, i; + int iguales; + + /* Agarro la primer clave entera como referencia */ + primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error); + for(i=1; icant; i++) { + actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error); + if (*actual == '*') { + free(actual); + continue; + } + iguales = strtol(actual, &resto, 10); + if ((iguales > 0) && (*resto == '|')) { + INDICE_DATO dummy2; + strncpy(salvar, primera, iguales); + salvar[iguales] = '\0'; + strcat(salvar, resto+1); /* +1 para saltar el separador */ + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy2); + free(actual); + } else { + free(primera); + primera = actual; + } + } + + free(primera); +} + +void insertar_ordenado(INDICE *idx, B_NodoEntry *buffer, int cant, B_NodoEntry nuevo_entry) +{ + int i, pos; + for(i=0; (ipos; i--) + buffer[i] = buffer[i-1]; + + buffer[pos] = nuevo_entry; +} + +static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre) +{ + PERR("PARTIR 2 EN 3"); + B_NodoEntry *buffer; + char *izq, *der, *padre, *nuevo; + B_NodoEntry *c_der, *c_izq, *c_nuevo, prom1, prom2; + B_NodoHeader h_der, h_izq, h_nuevo; + int i, j, nodo_nuevo; + int cant_claves; + + /* Leo los nodos y los datos */ + der = b_leer_nodo(idx, nodo_der); + izq = b_leer_nodo(idx, nodo_izq); + + b_leer_header(der, &h_der); + b_leer_header(izq, &h_izq); + + c_der = b_leer_claves(der, &h_der); + c_izq = b_leer_claves(izq, &h_izq); + + cant_claves = 2*CANT_HIJOS(idx)+2; + buffer = malloc(cant_claves*sizeof(B_NodoEntry)); + + for(i=0, j=0; iemu_mult->leer_registro(idx->emu_mult, k, &tam, &error); + + if (leido == NULL) { + PERR("LEI CUALQUIER COSA, BUG?"); + return 1; + } + + cant = *((int *)leido); + + /* Obtengo un nuevo lugar para el dato nuevo */ + array = (INDICE_DATO *)(leido+sizeof(int)); + + /* busco pos de dato en array */ + for(pos=0; posemu_mult->borrar_registro(idx->emu_mult, k, dummy1); + return 0; + } + + /* Quito el elemento */ + leido = realloc(leido, sizeof(int)+cant*sizeof(INDICE_DATO)); + + /* Actualizo la cantidad */ + (*((int *)leido)) = cant; + + error = 0; + idx->emu_mult->modificar_registro(idx->emu_mult, + k, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error, + dummy1 + ); + + free(leido); + + return cant; +} + +#ifdef NO_TERMINAOD +EMUFS_Estadisticas emufs_indice_b_obtener_estadisticas(INDICE *idx) +{ + EMUFS_Estadisticas stats, st_string, st_multiples; + + stats.tam_archivo = emufs_common_get_file_size(idx->filename); + stats.cant_bloques = stats.tam_archivo/idx->tam_bloque; + } +#endif +#include "indice_b_asc.c"