]> git.llucax.com Git - z.facultad/75.06/emufs.git/blobdiff - emufs/indice_b.c
el copy paste me va a mandar a la ruina... bugs corregidos.. ahora si anda todo como...
[z.facultad/75.06/emufs.git] / emufs / indice_b.c
index 89a5b7715e8792c7670db4e0e1914269e6faa983..ef051127b5e2f86a039efd3782fa935c4fbc3c50 100644 (file)
@@ -43,12 +43,13 @@ static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_No
 /** Junta 2 nodos y hace uno solo */
 static void b_fundir_nodo(INDICE *,char *, int, char *, int, char *, int, int);
 /** Crea 3 nodos a partir de 2 llenos */
-static void b_partir_dos_nodos_en_tres(INDICE*, int nodo_izq, int nodo_der, int padre, B_NodoEntry nuevo_entry);
+static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre);
                        
 static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo);
 
 static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
 static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
+int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k, INDICE_DATO dato);
 
 void emufs_indice_b_crear(INDICE *idx)
 {
@@ -74,6 +75,7 @@ void emufs_indice_b_crear(INDICE *idx)
        memcpy(bloque, &header, sizeof(B_NodoHeader));
 
        fwrite(bloque, idx->tam_bloque, 1, fp);
+       free(bloque);
        fclose(fp);
 }
 
@@ -103,13 +105,13 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato)
                                PERR(idx->nombre);
                                return 0;
                        }
-                       
-                       /* TODO : Implementar carga de valor en clave duplicada! */
-                       b_insertar_dup_en_pos(idx, claves[i].dato, dato);
+       
+                       if ((idx->funcion == IND_SELECCION) && (!emufs_indice_es_clave_nula(idx, clave)))
+                               b_insertar_dup_en_pos(idx, claves[i].dato, dato);
                
                        if (idx->tipo_dato == IDX_STRING) {
                                /* Tengo que sacar el texto repetido del archivo de textos */
-                               idx->emu_string->borrar_registro(idx->emu_string, clave);
+                               idx->emu_string->borrar_registro(idx->emu_string, clave, dummy);
                        }
                        return 1;
                } else {
@@ -131,6 +133,11 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato)
                /* Agrego el DATO real al archivo de claves repetiras
                 * y me guardo el ID para poner en el indice
                 */
+               if ((idx->funcion == IND_SELECCION) && (emufs_indice_es_clave_nula(idx, clave)))
+                       /* UPS!, la clave que se va a insertar por primera vez es nula
+                        * y soy un indice selectivo!, no lo puedo permitir, ciao!!
+                        */
+                       return 1;
                dummy.id = -1;
                dato.id = b_insertar_dup_en_pos(idx, dummy, dato);
        }
@@ -180,7 +187,7 @@ INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave)
        return ret;
 }
 
-int emufs_indice_b_borrar(INDICE *idx, CLAVE k)
+int emufs_indice_b_borrar(INDICE *idx, CLAVE k, INDICE_DATO dato)
 {
        /* Busco el nodo que contiene la clave,si es que esta existe */
        char *nodo;
@@ -216,8 +223,19 @@ int emufs_indice_b_borrar(INDICE *idx, CLAVE k)
 
        if (encontrado) {
                PERR("Clave encontrada, borrando ...");
-               fprintf(stderr, "La clave a borrar esta en el nodo %d\n", nodo_id);
-               b_borrar_clave(idx, nodo, nodo_id, k);
+               fprintf(stderr, "%s: La clave a borrar esta en el nodo %d\n", idx->nombre, nodo_id);
+               if (idx->funcion != IND_PRIMARIO) {
+                       /* Debo borrar primero la clave desde el archivo de
+                        * claves repetidas, y si recien ahi me quedo sin claves,
+                        * borrar la clave del arbol
+                        */
+                       PERR("Vamos a borrar duplicados");
+                       encontrado = b_borrar_dup_clave(idx, claves[i].dato, dato);
+                       fprintf(stderr, "Listo, encontrado = %d\n", encontrado);
+               }
+               if (encontrado) {
+                       b_borrar_clave(idx, nodo, nodo_id, k);
+               }
        } else {
                PERR("Clave no encontrada");
        }
@@ -261,8 +279,8 @@ char *b_leer_nodo(INDICE *idx, int id)
 {
        FILE *fp;
        char *out;
-       B_NodoHeader header;
-       B_NodoEntry *claves;
+       /*B_NodoHeader header;
+       B_NodoEntry *claves;*/
 
        if (id < 0) return NULL;
 
@@ -285,11 +303,11 @@ char *b_leer_nodo(INDICE *idx, int id)
        }
 
        /* Si estoy manejando string tengo que sacar las abreviaturas */
-       if (idx->tipo_dato == IDX_STRING) {
+/*     if (idx->tipo_dato == IDX_STRING) {
                b_leer_header(out, &header);
                claves = b_leer_claves(out, &header);
                desabreviar_claves(idx, claves, &header);
-       }
+       }*/
        fclose(fp);
        return out;
 }
@@ -297,15 +315,15 @@ char *b_leer_nodo(INDICE *idx, int id)
 static void b_grabar_nodo(INDICE *idx, int id, char *data)
 {
        FILE *fp;
-       B_NodoHeader header;
-       B_NodoEntry *claves;
+       /*B_NodoHeader header;
+       B_NodoEntry *claves;*/
 
        /* Si las claves son de tipo string debo abreviar antes de guardar */
-       if (idx->tipo_dato == IDX_STRING) {
+/*     if (idx->tipo_dato == IDX_STRING) {
                b_leer_header(data, &header);
                claves = b_leer_claves(data, &header);
                abreviar_claves(idx, claves, &header);
-       }
+       }*/
        fp = fopen(idx->filename, "r+");
        fseek(fp, id*idx->tam_bloque, SEEK_SET);
        fwrite(data, 1, idx->tam_bloque, fp);
@@ -529,7 +547,6 @@ void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, in
                claves[i-1].hijo_derecho = hijo_izq;
                claves[i].hijo_derecho = hijo_der;
        }
-       /*b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);*/
 
        b_actualizar_header(nodo, &nodo_header);
        b_grabar_nodo(idx, nodo_id, nodo);
@@ -655,9 +672,6 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
        fprintf(stderr, "La clave esta en la pos = %d\n", pos);
        if (header.hijo_izquierdo != -1) {
                PERR("Nodo no es hoja, intercambio");
-/*             if (pos == 0) {
-                       actual = b_leer_nodo(idx, nodo_header.hijo_izquierdo);
-               else*/
                actual = b_leer_nodo(idx, claves[pos].hijo_derecho);
                actual_id = claves[pos].hijo_derecho;
                p = claves[pos].hijo_derecho;
@@ -698,7 +712,7 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
        /* Se cumple la condicion de hijos? */
        PERR("Dejo todo consistente");
        fprintf(stderr, "Condicion : %d >= %d\n", header_actual.cant, MIN_HIJOS(idx));
-       if (header_actual.cant >= MIN_HIJOS(idx)) {
+       if ((header_actual.cant >= MIN_HIJOS(idx)) || (actual_id == 0)) {
                PERR("Borrar completo sin fundir");
                return;
        }
@@ -707,6 +721,7 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
        /* Tengo que pasar datos o fundir nodos :-( */
        do {
                padre_id = header.padre;
+               if (padre_id == -1) continue;
                padre = b_leer_nodo(idx, padre_id);
                b_leer_header(padre, &header_padre);
                claves_padre = b_leer_claves(padre, &header_padre);
@@ -719,6 +734,7 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
                        derecha_id = claves_padre[0].hijo_derecho;
                        der = b_leer_nodo(idx, derecha_id);
                        b_leer_header(der, &header_der);
+                       pos_padre = 0;
                } else {
                        PERR("Buscando que hijo soy");
                        for(pos_padre=0; (claves_padre[pos_padre].hijo_derecho != actual_id); pos_padre++)      {       }
@@ -752,6 +768,7 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
                if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) {
                        PERR("Le pido clave a derecha");
                        fprintf(stderr, "ANTES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant);
+                       fprintf(stderr, "PEDIR DERECHA DATOS : yo=%d, padre=%d, der=%d, pos_clave=%d\n", actual_id, padre_id, derecha_id, pos_padre);
                        b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre);
                        PERR("listo");
                        b_leer_header(der, &header_der);
@@ -797,6 +814,7 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_
        B_NodoHeader h_der, h_padre, h_nodo;
        B_NodoEntry *c_der, *c_padre, *c_nodo;
 
+       PERR("Derecha 1");
        b_leer_header(nodo, &h_nodo);
        c_nodo = b_leer_claves(nodo, &h_nodo);
        b_leer_header(der, &h_der);
@@ -804,13 +822,16 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_
        b_leer_header(padre, &h_padre);
        c_padre = b_leer_claves(padre, &h_padre);
 
+       PERR("Derecha 2");
        c_nodo[h_nodo.cant] = c_padre[pos_clave+1];
        c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */
 
+       PERR("Derecha 3");
        c_padre[pos_clave+1] = c_der[0];
        c_padre[pos_clave+1].hijo_derecho = der_id;
        
        /* Muevo las claves de derecho */
+       PERR("Derecha 4");
        for(i=0; i<h_der.cant-1; i++) {
                c_der[i] = c_der[i+1];
        }
@@ -819,6 +840,7 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_
 
        b_actualizar_header(der, &h_der);
        b_actualizar_header(nodo, &h_nodo);
+       PERR("Derecha 5");
 }
 
 void b_pasar_clave_a_derecha(INDICE *idx, char *der, int der_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry)
@@ -830,8 +852,9 @@ void b_pasar_clave_a_derecha(INDICE *idx, char *der, int der_id, char *padre, in
        b_leer_header(der, &der_h);
        padre_entries = b_leer_claves(padre, &padre_h);
        /* Inserto en el hijo derecho la clave del padre */
+       PERR("PASAR CLAVE DERECHA");
        b_insertar_en_nodo_con_lugar(idx, padre_entries[padre_pos].clave, padre_entries[padre_pos].dato,
-                       der_id, der, entry.hijo_derecho, der_h.hijo_izquierdo);
+                       der_id, der, der_h.hijo_izquierdo, entry.hijo_derecho);
        /* Reemplazo clave del padre por clave nueva */
        entry.hijo_derecho = der_id;
        padre_entries[padre_pos] = entry;
@@ -960,12 +983,14 @@ static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_D
                if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!");
        } else {
                /* Modifico el que ya existia! */
+               INDICE_DATO dummy;
                error = 0;
                idx->emu_mult->modificar_registro(idx->emu_mult,
                        k,
                        leido,
                        cant*sizeof(INDICE_DATO)+sizeof(int),
-                       &error
+                       &error,
+                       dummy
                );
        }
        /* Clean up! */
@@ -1010,10 +1035,11 @@ static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *heade
                 * mas de 2 letras iguales, si no no gano nada y complica las cosas
                 */
                if (iguales > 1) {
+                       INDICE_DATO dummy1;
                        sprintf(salvar, "%d|%s", iguales, resto);
                        free(actual);
                        error = 0;
-                       idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error);
+                       idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy1);
                } else {
                        free(primera);
                        primera = actual;
@@ -1040,10 +1066,11 @@ static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *he
                }
                iguales = strtol(actual, &resto, 10);
                if ((iguales > 0) && (*resto == '|')) {
+                       INDICE_DATO dummy2;
                        strncpy(salvar, primera, iguales);
                        salvar[iguales] = '\0';
                        strcat(salvar, resto+1); /* +1 para saltar el separador */
-                       idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error);
+                       idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy2);
                        free(actual);
                } else {
                        free(primera);
@@ -1054,8 +1081,83 @@ static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *he
        free(primera);
 }
 
-static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, int padre, B_NodoEntry nuevo_entry)
+void insertar_ordenado(INDICE *idx, B_NodoEntry *buffer, int cant, B_NodoEntry nuevo_entry)
+{
+       int i, pos;
+       for(i=0; (i<cant) && emufs_indice_es_menor(idx, buffer[i].clave, nuevo_entry.clave); i++) {}
+       pos = i;
+
+       for(i=cant; i>pos; i--)
+               buffer[i] = buffer[i-1];
+
+       buffer[pos] = nuevo_entry;
+}
+
+static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre)
 {
+       PERR("PARTIR 2 EN 3");
+       B_NodoEntry *buffer;
+       char *izq, *der, *padre, *nuevo;
+       B_NodoEntry *c_der, *c_izq, *c_nuevo, prom1, prom2;
+       B_NodoHeader h_der, h_izq, h_nuevo;
+       int i, j, nodo_nuevo;
+       int cant_claves;
+
+       /* Leo los nodos y los datos */
+       der = b_leer_nodo(idx, nodo_der);
+       izq = b_leer_nodo(idx, nodo_izq);
+
+       b_leer_header(der, &h_der);
+       b_leer_header(izq, &h_izq);
+
+       c_der = b_leer_claves(der, &h_der);
+       c_izq = b_leer_claves(izq, &h_izq);
+
+       cant_claves = 2*CANT_HIJOS(idx)+2;
+       buffer = malloc(cant_claves*sizeof(B_NodoEntry));
+       
+       for(i=0, j=0; i<h_izq.cant; i++, j++)
+               buffer[j] = c_izq[i];
+
+       buffer[j++] = padre_entry;
+
+       for(i=0; i<h_der.cant; i++, j++)
+               buffer[j] = c_der[i];
+
+       insertar_ordenado(idx, buffer, cant_claves-1, nuevo_entry);
+
+       nuevo = b_crear_nodo(idx, &nodo_nuevo);
+       b_leer_header(nuevo, &h_nuevo);
+       c_nuevo = b_leer_claves(nuevo, &h_nuevo);
+
+       /* lleno el lado derecho e izquierdo */
+       for(i=0, j=0; i<cant_claves/3; i++, j++)
+               c_izq[j] = buffer[i];
+       prom1 = buffer[i++];
+       h_izq.cant = j;
+       for(j=0; i<2*cant_claves/3; i++, j++)
+               c_der[j] = buffer[i];
+       h_der.cant = j;
+       prom2 = buffer[i++];
+       for(j=0; i<cant_claves; i++,j++)
+               c_nuevo[j] = buffer[i];
+       h_nuevo.cant = j;
+
+       /* Actualizo headers y salvo */
+       b_actualizar_header(der, &h_der);
+       b_actualizar_header(izq, &h_izq);
+       b_actualizar_header(nuevo, &h_nuevo);
+       b_grabar_nodo(idx, nodo_izq, izq);
+       b_grabar_nodo(idx, nodo_der, der);
+       b_grabar_nodo(idx, nodo_nuevo, nuevo);
+
+       free(der);
+       free(izq);
+       free(nuevo);
+       padre = b_leer_nodo(idx, id_padre);
+       b_insertar_en_nodo(idx, prom1.clave, prom1.dato, id_padre, padre, nodo_izq, nodo_der);
+       b_insertar_en_nodo(idx, prom2.clave, prom2.dato, id_padre, padre, nodo_der, nodo_nuevo);
+       
        /*
         * PSEUDOCODIGO    TODO FIXME XXX TODO FIXME XXX TODO FIXME XXX
         *
@@ -1151,14 +1253,18 @@ CLAVE emufs_indice_b_obtener_sig_clave(INDICE *idx, CLAVE k)
                while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) i++;
                if ((i<header.cant) && (emufs_indice_es_igual(idx, claves[i].clave, k))) {                              
                                /* LA ENCONTRE! , ahora busco la siguiente clave!! */           
+                               fprintf(stderr, "Me encontre en pos %d en el padre\n", i);
                                if ((i+1)<header.cant) {
+                                       PERR("Joya, hay lugar a la derecha");
                                        if (claves[i].hijo_derecho == -1) {
+                                               PERR("Y soy hoja!!");
                                                /* Joya!, fue facil, la siguiente va en camino! */
-                                               salida = claves[i].clave;
+                                               salida = claves[i+1].clave;
                                                free(nodo);
                                                return salida;
                                        }
 
+                                       PERR("No soy hoja, busco la hoja de menor");
                                        /* Mmmmm ... la siguiente esta en uno de mis hijo */
                                        /* Necesito la mas chica de las siguientes, para eso
                                         * me voy a mi hijo derecho y de ahi bajo siempre
@@ -1178,21 +1284,45 @@ CLAVE emufs_indice_b_obtener_sig_clave(INDICE *idx, CLAVE k)
                                        return salida;
                                }
 
+                               PERR("Fuck, tengo que ir otro nodo a buscar");
                                /* Fuck, la siguiente clave la tengo que sacar de padre */
                                /* Busco al mi padre, perdido en un maremoto hace mucho,muchos
                                 * aƱos
                                 */
+                               tmp = nodo;
+                               if (header.padre == -1) {
+                                       if (nodo_id == 0) {
+                                               /* Bien, son el nodo raiz y aca tendria que ir hacia mi hijo
+                                                * derecho
+                                                */
+                                               nodo = b_leer_nodo(idx, claves[header.cant-1].hijo_derecho);
+                                               free(tmp);
+                                               b_leer_header(nodo, &header);
+                                               claves = b_leer_claves(nodo, &header);
+
+                                               salida = claves[0].clave;
+                                       }
+                                       return salida;
+                               }
                                free(nodo);
                                nodo = b_leer_nodo(idx, header.padre);
                                b_leer_header(nodo, &header);
                                claves = b_leer_claves(nodo, &header);
                                i = 0;
-                               while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) i++;
-                               if (i<header.cant)
+                               PERR("Busco mi siguiente en mi padre");
+                               fprintf(stderr, "Padre tiene %d claves\n", header.cant);
+                               while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) {
+                                       i++;
+                                       fprintf(stderr, "Proximo i : %d\n", i);
+                               }
+                               if (i<header.cant) {
+                                       PERR("Siguiente clave encontrada");
                                        salida = claves[i].clave;
-                               else
+                               } else {
                                        /* No hay mas claves! */
+                                       PERR("Busque y busque pero no aparecio");
                                        salida.i_clave = -1;
+                               }
                                return salida;
                } else {
                        tmp = nodo;
@@ -1209,7 +1339,72 @@ CLAVE emufs_indice_b_obtener_sig_clave(INDICE *idx, CLAVE k)
        }
 
        /* No encontre la clave pasada, no existe */
+       PERR("No encontre la clave pasada!!");
        salida.i_clave = -1;
        return salida;
 }
 
+int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k_dato, INDICE_DATO dato)
+{
+       int cant, pos, i;
+       EMUFS_REG_SIZE tam;
+       int error=0;
+       INDICE_DATO *array;
+       INDICE_DATO dummy1;
+       char *leido;
+       CLAVE k;
+
+       /* Leo el contenido actual */
+       error = 0;
+       k.i_clave = k_dato.id;
+       leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error);
+
+       if (leido == NULL) {
+               PERR("LEI CUALQUIER COSA, BUG?");
+               return 1;
+       }
+
+       cant = *((int *)leido);
+
+       /* Obtengo un nuevo lugar para el dato nuevo */
+       array = (INDICE_DATO *)(leido+sizeof(int));
+
+       /* busco pos de dato en array */
+       for(pos=0; pos<cant; pos++) {
+               if (array[pos].id == dato.id) break;
+       }
+
+       for(i=pos; i<cant-1; i++)
+               array[pos] = array[pos+1];
+
+       cant--;
+
+       if (cant == 0) {
+               free(leido);
+               /* No tengo mas cosas en esta clave, la borro */
+               PERR("EL REGISTRO MULTIPLE QUEDO VACIO, ELIMINANDO");
+               idx->emu_mult->borrar_registro(idx->emu_mult, k, dummy1);
+               return 0;
+       }
+
+       /* Quito el elemento */
+       leido = realloc(leido, sizeof(int)+cant*sizeof(INDICE_DATO));
+
+       /* Actualizo la cantidad */
+       (*((int *)leido)) = cant;
+
+       error = 0;
+       idx->emu_mult->modificar_registro(idx->emu_mult,
+               k,
+               leido,
+               cant*sizeof(INDICE_DATO)+sizeof(int),
+               &error,
+               dummy1
+       );
+       
+       free(leido);
+       
+       return cant;
+}
+
+#include "indice_b_asc.c"