]> git.llucax.com Git - z.facultad/75.06/emufs.git/blobdiff - emufs/indice_b.c
Subo cosas de external sort con las que estoy trabajando. Todavia no hay nada utiliza...
[z.facultad/75.06/emufs.git] / emufs / indice_b.c
index eba1739c90603b4cc67b89f275aede57d43fadc8..8f43582b228939577878ca7e9b156b5efbb23b62 100644 (file)
@@ -49,6 +49,7 @@ static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_D
 
 static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
 static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
+int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k, INDICE_DATO dato);
 
 void emufs_indice_b_crear(INDICE *idx)
 {
@@ -104,12 +105,11 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato)
                                return 0;
                        }
                        
-                       /* TODO : Implementar carga de valor en clave duplicada! */
                        b_insertar_dup_en_pos(idx, claves[i].dato, dato);
                
                        if (idx->tipo_dato == IDX_STRING) {
                                /* Tengo que sacar el texto repetido del archivo de textos */
-                               idx->emu_string->borrar_registro(idx->emu_string, clave);
+                               idx->emu_string->borrar_registro(idx->emu_string, clave, dummy);
                        }
                        return 1;
                } else {
@@ -180,7 +180,7 @@ INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave)
        return ret;
 }
 
-int emufs_indice_b_borrar(INDICE *idx, CLAVE k)
+int emufs_indice_b_borrar(INDICE *idx, CLAVE k, INDICE_DATO dato)
 {
        /* Busco el nodo que contiene la clave,si es que esta existe */
        char *nodo;
@@ -216,8 +216,19 @@ int emufs_indice_b_borrar(INDICE *idx, CLAVE k)
 
        if (encontrado) {
                PERR("Clave encontrada, borrando ...");
-               fprintf(stderr, "La clave a borrar esta en el nodo %d\n", nodo_id);
-               b_borrar_clave(idx, nodo, nodo_id, k);
+               fprintf(stderr, "%s: La clave a borrar esta en el nodo %d\n", idx->nombre, nodo_id);
+               if (idx->funcion != IND_PRIMARIO) {
+                       /* Debo borrar primero la clave desde el archivo de
+                        * claves repetidas, y si recien ahi me quedo sin claves,
+                        * borrar la clave del arbol
+                        */
+                       PERR("Vamos a borrar duplicados");
+                       encontrado = b_borrar_dup_clave(idx, claves[i].dato, dato);
+                       fprintf(stderr, "Listo, encontrado = %d\n", encontrado);
+               }
+               if (encontrado) {
+                       b_borrar_clave(idx, nodo, nodo_id, k);
+               }
        } else {
                PERR("Clave no encontrada");
        }
@@ -261,8 +272,8 @@ char *b_leer_nodo(INDICE *idx, int id)
 {
        FILE *fp;
        char *out;
-       B_NodoHeader header;
-       B_NodoEntry *claves;
+       /*B_NodoHeader header;
+       B_NodoEntry *claves;*/
 
        if (id < 0) return NULL;
 
@@ -285,11 +296,11 @@ char *b_leer_nodo(INDICE *idx, int id)
        }
 
        /* Si estoy manejando string tengo que sacar las abreviaturas */
-       if (idx->tipo_dato == IDX_STRING) {
+/*     if (idx->tipo_dato == IDX_STRING) {
                b_leer_header(out, &header);
                claves = b_leer_claves(out, &header);
                desabreviar_claves(idx, claves, &header);
-       }
+       }*/
        fclose(fp);
        return out;
 }
@@ -297,15 +308,15 @@ char *b_leer_nodo(INDICE *idx, int id)
 static void b_grabar_nodo(INDICE *idx, int id, char *data)
 {
        FILE *fp;
-       B_NodoHeader header;
-       B_NodoEntry *claves;
+       /*B_NodoHeader header;
+       B_NodoEntry *claves;*/
 
        /* Si las claves son de tipo string debo abreviar antes de guardar */
-       if (idx->tipo_dato == IDX_STRING) {
+/*     if (idx->tipo_dato == IDX_STRING) {
                b_leer_header(data, &header);
                claves = b_leer_claves(data, &header);
                abreviar_claves(idx, claves, &header);
-       }
+       }*/
        fp = fopen(idx->filename, "r+");
        fseek(fp, id*idx->tam_bloque, SEEK_SET);
        fwrite(data, 1, idx->tam_bloque, fp);
@@ -529,7 +540,6 @@ void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, in
                claves[i-1].hijo_derecho = hijo_izq;
                claves[i].hijo_derecho = hijo_der;
        }
-       /*b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);*/
 
        b_actualizar_header(nodo, &nodo_header);
        b_grabar_nodo(idx, nodo_id, nodo);
@@ -655,9 +665,6 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
        fprintf(stderr, "La clave esta en la pos = %d\n", pos);
        if (header.hijo_izquierdo != -1) {
                PERR("Nodo no es hoja, intercambio");
-/*             if (pos == 0) {
-                       actual = b_leer_nodo(idx, nodo_header.hijo_izquierdo);
-               else*/
                actual = b_leer_nodo(idx, claves[pos].hijo_derecho);
                actual_id = claves[pos].hijo_derecho;
                p = claves[pos].hijo_derecho;
@@ -698,7 +705,7 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
        /* Se cumple la condicion de hijos? */
        PERR("Dejo todo consistente");
        fprintf(stderr, "Condicion : %d >= %d\n", header_actual.cant, MIN_HIJOS(idx));
-       if (header_actual.cant >= MIN_HIJOS(idx)) {
+       if ((header_actual.cant >= MIN_HIJOS(idx)) && (actual_id != 0)) {
                PERR("Borrar completo sin fundir");
                return;
        }
@@ -707,6 +714,7 @@ static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
        /* Tengo que pasar datos o fundir nodos :-( */
        do {
                padre_id = header.padre;
+               if (padre_id == -1) continue;
                padre = b_leer_nodo(idx, padre_id);
                b_leer_header(padre, &header_padre);
                claves_padre = b_leer_claves(padre, &header_padre);
@@ -797,6 +805,7 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_
        B_NodoHeader h_der, h_padre, h_nodo;
        B_NodoEntry *c_der, *c_padre, *c_nodo;
 
+       PERR("Derecha 1");
        b_leer_header(nodo, &h_nodo);
        c_nodo = b_leer_claves(nodo, &h_nodo);
        b_leer_header(der, &h_der);
@@ -804,13 +813,16 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_
        b_leer_header(padre, &h_padre);
        c_padre = b_leer_claves(padre, &h_padre);
 
+       PERR("Derecha 2");
        c_nodo[h_nodo.cant] = c_padre[pos_clave+1];
        c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */
 
+       PERR("Derecha 3");
        c_padre[pos_clave+1] = c_der[0];
        c_padre[pos_clave+1].hijo_derecho = der_id;
        
        /* Muevo las claves de derecho */
+       PERR("Derecha 4");
        for(i=0; i<h_der.cant-1; i++) {
                c_der[i] = c_der[i+1];
        }
@@ -819,6 +831,7 @@ static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_
 
        b_actualizar_header(der, &h_der);
        b_actualizar_header(nodo, &h_nodo);
+       PERR("Derecha 5");
 }
 
 void b_pasar_clave_a_derecha(INDICE *idx, char *der, int der_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry)
@@ -960,12 +973,14 @@ static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_D
                if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!");
        } else {
                /* Modifico el que ya existia! */
+               INDICE_DATO dummy;
                error = 0;
                idx->emu_mult->modificar_registro(idx->emu_mult,
                        k,
                        leido,
                        cant*sizeof(INDICE_DATO)+sizeof(int),
-                       &error
+                       &error,
+                       dummy
                );
        }
        /* Clean up! */
@@ -1010,10 +1025,11 @@ static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *heade
                 * mas de 2 letras iguales, si no no gano nada y complica las cosas
                 */
                if (iguales > 1) {
+                       INDICE_DATO dummy1;
                        sprintf(salvar, "%d|%s", iguales, resto);
                        free(actual);
                        error = 0;
-                       idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error);
+                       idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy1);
                } else {
                        free(primera);
                        primera = actual;
@@ -1040,10 +1056,11 @@ static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *he
                }
                iguales = strtol(actual, &resto, 10);
                if ((iguales > 0) && (*resto == '|')) {
+                       INDICE_DATO dummy2;
                        strncpy(salvar, primera, iguales);
                        salvar[iguales] = '\0';
                        strcat(salvar, resto+1); /* +1 para saltar el separador */
-                       idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error);
+                       idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy2);
                        free(actual);
                } else {
                        free(primera);
@@ -1132,3 +1149,159 @@ CLAVE emufs_indice_b_obtener_mayor_clave(INDICE *idx)
        return k;
 }
 
+CLAVE emufs_indice_b_obtener_sig_clave(INDICE *idx, CLAVE k)
+{
+       int i;
+       B_NodoHeader header;
+       B_NodoEntry *claves;
+       char *nodo, *tmp;
+       int nodo_id;
+       CLAVE salida;
+       
+       /* Primero busco la clave pasada por parametro */
+       nodo = b_leer_nodo(idx, 0);
+       nodo_id = 0;
+       while (nodo) {
+               b_leer_header(nodo, &header);
+               claves = b_leer_claves(nodo, &header);
+               i=0;
+               while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) i++;
+               if ((i<header.cant) && (emufs_indice_es_igual(idx, claves[i].clave, k))) {                              
+                               /* LA ENCONTRE! , ahora busco la siguiente clave!! */           
+                               fprintf(stderr, "Me encontre en pos %d en el padre\n", i);
+                               if ((i+1)<header.cant) {
+                                       PERR("Joya, hay lugar a la derecha");
+                                       if (claves[i].hijo_derecho == -1) {
+                                               PERR("Y soy hoja!!");
+                                               /* Joya!, fue facil, la siguiente va en camino! */
+                                               salida = claves[i+1].clave;
+                                               free(nodo);
+                                               return salida;
+                                       }
+
+                                       PERR("No soy hoja, busco la hoja de menor");
+                                       /* Mmmmm ... la siguiente esta en uno de mis hijo */
+                                       /* Necesito la mas chica de las siguientes, para eso
+                                        * me voy a mi hijo derecho y de ahi bajo siempre
+                                        * hacia la izquierda hacia una hoja */
+                                       i = claves[i].hijo_derecho;
+                                       free(nodo);
+                                       nodo = b_leer_nodo(idx, i);
+                                       b_leer_header(nodo, &header);
+                                       while (header.hijo_izquierdo != -1) {
+                                               free(nodo);
+                                               nodo = b_leer_nodo(idx, header.hijo_izquierdo);
+                                               b_leer_header(nodo, &header);
+                                       }
+                                       claves = b_leer_claves(nodo, &header);
+                                       salida = claves[0].clave;
+                                       free(nodo);
+                                       return salida;
+                               }
+
+                               PERR("Fuck, tengo que ir otro nodo a buscar");
+                               /* Fuck, la siguiente clave la tengo que sacar de padre */
+                               /* Busco al mi padre, perdido en un maremoto hace mucho,muchos
+                                * aƱos
+                                */
+                               free(nodo);
+                               if (header.padre == -1) {
+                                       salida.i_clave = -1;
+                                       return salida;
+                               }
+                               nodo = b_leer_nodo(idx, header.padre);
+                               b_leer_header(nodo, &header);
+                               claves = b_leer_claves(nodo, &header);
+                               i = 0;
+                               PERR("Busco mi siguiente en mi padre");
+                               fprintf(stderr, "Padre tiene %d claves\n", header.cant);
+                               while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) {
+                                       i++;
+                                       fprintf(stderr, "Proximo i : %d\n", i);
+                               }
+                               if (i<header.cant) {
+                                       PERR("Siguiente clave encontrada");
+                                       salida = claves[i].clave;
+                               } else {
+                                       /* No hay mas claves! */
+                                       PERR("Busque y busque pero no aparecio");
+                                       salida.i_clave = -1;
+                               }
+                               return salida;
+               } else {
+                       tmp = nodo;
+                       b_grabar_nodo(idx, nodo_id, nodo);
+                       if (i == 0) {
+                               nodo = b_leer_nodo(idx, header.hijo_izquierdo);
+                               nodo_id = header.hijo_izquierdo;
+                       } else {
+                               nodo = b_leer_nodo(idx, claves[i-1].hijo_derecho);
+                               nodo_id = claves[i-1].hijo_derecho;
+                       }
+                       free(tmp);
+               }
+       }
+
+       /* No encontre la clave pasada, no existe */
+       PERR("No encontre la clave pasada!!");
+       salida.i_clave = -1;
+       return salida;
+}
+
+int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k_dato, INDICE_DATO dato)
+{
+       int cant, pos, i;
+       EMUFS_REG_SIZE tam;
+       int error=0;
+       INDICE_DATO *array;
+       INDICE_DATO dummy1;
+       char *leido;
+       CLAVE k;
+
+       /* Leo el contenido actual */
+       error = 0;
+       k.i_clave = k_dato.id;
+       leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error);
+
+       cant = *((int *)leido);
+
+       /* Obtengo un nuevo lugar para el dato nuevo */
+       array = (INDICE_DATO *)(leido+sizeof(int));
+
+       /* busco pos de dato en array */
+       for(pos=0; pos<cant; pos++) {
+               if (array[pos].id == dato.id) break;
+       }
+
+       for(i=pos; i<cant-1; i++)
+               array[pos] = array[pos+1];
+
+       cant--;
+
+       if (cant == 0) {
+               free(leido);
+               /* No tengo mas cosas en esta clave, la borro */
+               idx->emu_mult->borrar_registro(idx->emu_mult, k, dummy1);
+               return 0;
+       }
+
+       /* Quito el elemento */
+       leido = realloc(leido, sizeof(int)+cant*sizeof(INDICE_DATO));
+
+       /* Actualizo la cantidad */
+       (*((int *)leido)) = cant;
+
+       error = 0;
+       idx->emu_mult->modificar_registro(idx->emu_mult,
+               k,
+               leido,
+               cant*sizeof(INDICE_DATO)+sizeof(int),
+               &error,
+               dummy1
+       );
+       
+       free(leido);
+       
+       return cant;
+}
+