]> git.llucax.com Git - z.facultad/75.06/emufs.git/blobdiff - emufs/b_plus.c
Comienzo a usar INDICE General, subo para poder hacer un rename de archivos
[z.facultad/75.06/emufs.git] / emufs / b_plus.c
index ab8402626d6a89f488451b32a319d92402c292e9..a30058bd9f9a4f1575a4d5876fe6687638809e51 100644 (file)
@@ -2,18 +2,18 @@
 #include "b_plus.h"
 
 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
-/* numerando los bloques */
 int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node);
-/*NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);*/
+NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);
 NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx);
 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
-/*int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query);*/
-int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, int num_nodo_padre, CLAVE clave);
-int b_plus_split_child(INDEXSPECS *idx,NODO_B_PLUS *new_root, int ,NODO_B_PLUS* raiz);
+int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
+int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
+int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query);
+int b_plus_get_num_nodo(INDEXSPECS *idx);
 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
 
 /** Crea un nuevo nodo y lo inicializa */
-NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx) {
+NODO_B_PLUS *b_plus_crearnodo(INDEX *idx) {
        
        NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
        if (nodo == NULL) return NULL;
@@ -57,165 +57,59 @@ int emufs_b_plus_crear(INDEXSPECS *idx) {
        return error;
 }
 
-/* Inserta una nueva clave y reestructura el arbol para que quede como debe */
-int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query)
-{
-       NODO_B_PLUS *curnode, *padre, *new_nodo;
-       int i,j, prox_nodo;
-       /* Comienzo leyendo la raiz, entry point de toda funcion */
-       curnode = b_plus_leer_nodo(idx,0);      
-       if (curnode == NULL) return -1;
-       padre = curnode;
-       while ( curnode->nivel > 0 && curnode ) {
-               for(i=0; i<curnode->cant_claves; i++){ 
-                       /* me fijo que si es mayor */
-                       if ( (query->clave.i_clave > curnode->claves[i])) {
-                               if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
-                                       continue; /*paso a la siguiente*/
-                               else {  /* si era la ultima, la clave deberia ir ahi */
-                                       /*cargo el proximo nodo*/
-                                       prox_nodo = curnode->hijos[i+1];
-                                       break; /*salgo del for*/
-                               }
-                       } else {  /*si no es mayor o igual es menor*/
-                               prox_nodo = curnode->hijos[i];
-                               break;
-                       }
-               }
-               padre = curnode;
-               curnode = b_plus_leer_nodo(idx, prox_nodo);
-       } 
-       /* aca tengo el nodo donde deberia ir la clave, y su padre */ 
-       
-       if ( curnode->cant_claves < idx->size_claves/sizeof(int) ){
-               int *claves_aux = (int*)malloc(idx->size_claves);
-               int *hijos_aux = (int*)malloc(idx->size_hijos);
-               memset(claves_aux,-1,idx->size_claves);
-               memset(hijos_aux,-1,idx->size_hijos);
-               i = 0;
-               while ( (curnode->claves[i] < query->clave.i_clave) && (i < curnode->cant_claves)){
-                       claves_aux[i] = curnode->claves[i];
-                       hijos_aux[i] = curnode->hijos[i];
-                       i++;
-               }
-               curnode->cant_claves++;
-               claves_aux[i] = query->clave.i_clave;
-               hijos_aux[i] = query->num_bloque;
-               for (j=i+1; j<curnode->cant_claves; j++){
-                       claves_aux[j] = curnode->claves[j-1];
-                       hijos_aux[j] = curnode->hijos[j-1];
-               }
-               free(curnode->claves);
-               free(curnode->hijos);
-               curnode->claves = claves_aux;
-               curnode->hijos = hijos_aux;
-               b_plus_grabar_nodo(idx, curnode, prox_nodo);
-               b_plus_destruir_nodo(curnode);
-       }
-               
-       /* si el nodo esta lleno tengo que splitear */
-       if ( curnode->cant_claves == idx->size_claves ) 
-       {
-               /**FIXME**/
-       }
-       return 0;
-}
 
-/** Busca el nro de bloque donde se debe guardar un reg con clave X */
-/** Si la clave entra en la raiz, la guarda, si no, busca el nodo hoja
-    donde debe ir y devuelve el bloque (en query) pero no graba la clave */
-/** Devuelve -1 si no hay un bloque donde insertar la nueva clave */
-int emufs_b_plus_get_bloque(INDEXSPECS *idx, INDEX_DAT *query) {
+/** Busca el nro de bloque donde se debe guardar un reg con clave X.
+ *  Posibilidades: return 0 - Encontro un bloque potencial
+ *                 return -1 - No hay clave, inserto clave de nuevo bloques
+ *                 return 1 - Hubo falla de lectura de un nodo, Abortar
+ */
+int emufs_b_plus_get_bloque(INDEX *idx, INDEX_DAT *query, int num_node) {
 
-    NODO_B_PLUS *curnode;
-       int i, prox_nodo;
-       /* Comienzo leyendo la raiz, entry point de toda funcion */
-       printf ("Buscando donde insertar clave: %i\n\n",query->clave.i_clave);
-       curnode = b_plus_leer_nodo(idx,0);      
-       if (curnode == NULL) return -1;
-       /* Me fijo si la raiz esta vacia */
-       if ( curnode->cant_claves == 0 ){ /* entra la clave en la raiz */ 
-               /* ojo que este es un caso muy particular */
-               /* aumento la cant de claves*/
-               curnode->cant_claves++;
-               /* inserto la clave en el nodo, como es la primera no hace falta ordenar nada*/
-               *(curnode->claves) = query->clave.i_clave;
-               /* En query->num_bloque viene un numero de bloque nuevo valido..*/
-               /* Le asigno al nodo del arbol el mismo numero que venia en query*/
-               *(curnode->hijos) = query->num_bloque;
-               /* Cargado el query salgo de la func, luego habra que actualizar el .dat */
-               /*grabo el nodo en el archivo*/
-               b_plus_grabar_nodo(idx, curnode, 0);
-               /* librero el nodo */
-               b_plus_destruir_nodo(curnode);
-               return 0;
-       } 
-       PERR("TENGO LA HOJA");  
-       /* Mientras no encontre la hoja con la clave, busco.. */
-       /* RECORDAR QUE LAS CLAVES DEBEN ESTAR ORDENADAS PARA QUE ESTO FUNCIONE !! */ 
-       while (curnode->nivel > 0 && curnode){  
-               /*recorro las claves hasta encontrar la primera mayor a la que quiero insertar*/
-               for(i=0; i<curnode->cant_claves; i++){ 
-                       /* me fijo que si es mayor */
-                       if ( (query->clave.i_clave > curnode->claves[i])) {
-                               if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
-                                       continue; /*paso a la siguiente*/
-                               else {  /* si era la ultima, la clave deberia ir ahi */
-                                       /*cargo el proximo nodo*/
-                                       prox_nodo = curnode->hijos[i+1];
-                                       break; /*salgo del for*/
-                               }
-                       } else {  /*si no es mayor o igual es menor*/
-                               prox_nodo = curnode->hijos[i];
-                               break;
-                       }
-               }
-               b_plus_destruir_nodo(curnode);
-               curnode = b_plus_leer_nodo(idx, prox_nodo);
-       } 
+       NODO_B_PLUS *nodo;
+       nodo = b_plus_leer_nodo(idx,num_node);
+       if (nodo == NULL) return 1;
+       int i = nodo->cant_claves - 1;
+       int exitcode = 0;
        
-       /*cuando salgo de aca deberia tener cargado en curnode el nodo hoja que busque*/
-       for (i=0; i<curnode->cant_claves-1; i++){
-               if ( query->clave.i_clave >= curnode->claves[i] ){
-                       if ( curnode->cant_claves != i ) /* si no es la ultima clave */
-                               continue;
-                       else {   /* si era la ultima */
-                               /* Cargo en query el numero del bloque donde deberia ir la nueva clave */
-                               query->num_bloque = curnode->hijos[i];
-                               b_plus_destruir_nodo(curnode);
-                               return 0;
-                       }
-               } else {  /* si no era mayor, era menor */
-                       if ( i == 0 ){ 
-                                                               
-                               /* ACA PODRIAMOS RETORNAR -1 COMO CODIGO DE ERROR QUE INFORMARIA QUE NO EXISTE 
-                                  UN NODO DONDE QUEPA LA CLAVE, ENTONCES HABRIA QUE LLAMAR A LA FUNCION QUE
-                                  ACTUALIZA EL ARBOL Y SE ENCARGA DE ARGREGAR LA CLAVE Y HACER EL SPLIT DE SER 
-                                  NECESARIO */
-                               /* Llamo a la funcion que mete una clave nueva en el arbol y le paso el bloque a donde 
-                                  tiene que apuntar */
-                               b_plus_insertar_clave(idx, query);
-                               b_plus_destruir_nodo(curnode);
-                               return 1; /* SE INSERTO NODO NUEVO */
-                       } else {
-                               query->num_bloque = curnode->hijos[i-1];
-                               b_plus_destruir_nodo(curnode);
-                               return 0;
-                       }
+       /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
+       if (nodo->nivel == 0) {
+        /* Vemos en que bloque deberia ir */
+               while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) i--;
+               if (i < 0) {
+                       /* La clave es menor que todas, debo insertarla */
+                       b_plus_destruir_nodo(nodo);                     
+                       emufs_b_plus_insertar(idx,query);                       
+                       return -1;
+               }
+               else {
+                       /* Encontre un bloque potencial */
+                       query->num_bloque = nodo->hijos[i];
+                       b_plus_destruir_nodo(nodo);                     
+                       return 0;
                }
        }
-
-       if (curnode) b_plus_destruir_nodo(curnode);
-       return 0;
+       else {
+               /* Buscamos por donde descender al siguiente nivel */
+               while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) i--;
+        i++;
+        num_node = nodo->hijos[i];
+               b_plus_destruir_nodo(nodo);
+               exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
+               return exitcode;                
+       }
 }
 
-NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) {
+NODO_B_PLUS *b_plus_leer_nodo(INDEX *idx, int num_node) {
 
-       int i = 0;
+       /*int i = 0;*/
        FILE *fp;
        NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
        char *disknode = (char*)malloc(idx->tam_bloque);
        
+       if (num_node < 0) {
+               PERR("Se intento leer nodo negativo!!\n");
+               exit(1);
+       }
        if (disknode == NULL) return NULL;
        if (memnode == NULL) return NULL;
        
@@ -242,26 +136,26 @@ NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) {
        memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
        free(disknode);
        
-       printf("Dumping Node_%i\n",num_node);
+       /*printf("Dumping Node_%i\n",num_node);
        printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
        printf("Claves:");
        for (i = 0; i < idx->size_claves/sizeof(int); ++i) printf(" %i",memnode->claves[i]);
        printf("\nHijos:");
        for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
-       printf("\nEnd Dump\n"); 
+       printf("\nEnd Dump\n"); */
        
        return memnode;
        
 }
 
-int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node)
+int b_plus_grabar_nodo(INDEX *idx, NODO_B_PLUS *nodo, int num_node)
 {
        FILE *fp;
        
        fp = fopen(idx->filename, "r+");
        if (fp == NULL) return -1;
                
-       fseek(fp,num_node*sizeof(NODO_B_PLUS),SEEK_SET);        
+       fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);      
        fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
        fwrite(nodo->claves,idx->size_claves,1,fp);
        fwrite(nodo->hijos,idx->size_hijos,1,fp);
@@ -278,39 +172,98 @@ int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
        return 0;
 }
 
-int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, int num_nodo_padre, CLAVE clave)
+int b_plus_split_child(INDEX *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
+{
+       /* locals */
+       int minclaves = ceil(idx->size_hijos/sizeof(int)/2)-1;
+       int numbrother,j = 0;
+       int es_interno = 1;
+       
+       NODO_B_PLUS *brother = b_plus_crearnodo(idx);
+       brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
+       
+       /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
+       /* pues el ancla se debe repetir ademas de subir */
+       if (brother->nivel == 0) {
+               brother->cant_claves = minclaves+1;
+               es_interno = 0;
+       }
+       else brother->cant_claves = minclaves;
+       
+       /* Copio las claves al brother derecho */
+       for (j = 0; j < brother->cant_claves; ++j)
+               brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
+       
+       /* Copio los hijos ya sea para hoja o no hoja. */
+       for (j = 0; j < brother->cant_claves+1; ++j)
+               brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
+       
+       /* Ahora me ocupo del nodo que se partio */
+       fullnode->cant_claves = minclaves;
+       /* Obtengo numero de nodo para brother y encadeno si es hoja */
+       numbrother = b_plus_get_num_nodo(idx);
+       if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
+       
+       /* Ahora fixeamos el padre, apuntando al nuevo hijo */
+       for (j = parent->cant_claves; j > ithchild; --j)
+               parent->hijos[j+1] = parent->hijos[j];
+       parent->hijos[ithchild+1] = numbrother;
+       
+       /* Idem pero subo la median key */
+       for (j = parent->cant_claves-1; j >= ithchild; --j)
+               parent->claves[j+1] = parent->claves[j];
+       parent->claves[ithchild] = fullnode->claves[minclaves];
+       parent->cant_claves++;
+       
+       /* Grabo los nodos en disco */
+       b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
+       b_plus_grabar_nodo(idx,brother,numbrother);
+       b_plus_grabar_nodo(idx,parent,numparent);
+       
+       b_plus_destruir_nodo(brother);
+       
+       return 0;
+}
+
+
+int b_plus_insert_nonfull(INDEX *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
 {
     int i, num_nodo_hijo;
     NODO_B_PLUS *hijo;
     
-    i = nodo->cant_claves;
+    i = nodo->cant_claves-1; 
     if ( nodo->nivel == 0 ){
-        while ( i >= 1 && clave.i_clave < nodo->claves[i] ){
+        while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ){
             nodo->claves[i+1] = nodo->claves[i];
+                       nodo->hijos[i+2] = nodo->hijos[i+1];
+                       nodo->hijos[i+1] = nodo->hijos[i];
             i--;
         }
-        nodo->claves[i+1] = clave.i_clave;
+        nodo->claves[i+1] = query->clave.i_clave;
+               nodo->hijos[i+1] = query->num_bloque;
         nodo->cant_claves++;
-        b_plus_destruir_nodo(nodo);
         b_plus_grabar_nodo(idx, nodo, num_nodo);
     } else { 
-        while ( i >= 1 && clave.i_clave < nodo->claves[i] ) 
+        while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) 
             i--;
         i++;
-        num_nodo_hijo = nodo->hijos[i-1];
+        num_nodo_hijo = nodo->hijos[i];
         hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
         if ( hijo->cant_claves == idx->size_claves/sizeof(int) ) {
-            b_plus_split_child(idx, nodo, i, hijo);
-            if ( clave.i_clave > nodo->claves[i] )
+            b_plus_split_child(idx, num_nodo, nodo, i, hijo);
+            if ( query->clave.i_clave > nodo->claves[i] )
                 i++;
         }
-        b_plus_insert_nonfull(idx, hijo, num_nodo_hijo, num_nodo_padre);
+               if (hijo) b_plus_destruir_nodo(hijo);
+               hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
+        b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
+               if (hijo) b_plus_destruir_nodo(hijo);   
     }
-    b_plus_destruir_nodo(hijo);
-    return 0;
+       
+       return 0;
 }    
 
-int b_tree_insertar(INDEXSPECS *idx, CLAVE clave)
+int emufs_b_plus_insertar(INDEX *idx, INDEX_DAT *query)
 {
     NODO_B_PLUS *raiz;
     
@@ -321,22 +274,29 @@ int b_tree_insertar(INDEXSPECS *idx, CLAVE clave)
         new_root->hijos[0] = b_plus_get_num_nodo(idx);
         b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
         b_plus_grabar_nodo(idx, new_root, 0);
-        b_plus_split_child(idx, new_root, 1, raiz);
-        b_plus_insert_nonfull(idx, new_root, 0, clave);
-    } else b_plus_insert_nonfull(idx, raiz, 0, clave);
+           b_plus_split_child(idx, 0, new_root, 0, raiz);
+        b_plus_insert_nonfull(idx, new_root, 0, query);
+               b_plus_destruir_nodo(new_root);
+    } else 
+       {
+               b_plus_insert_nonfull(idx, raiz, 0, query);
+       }
+       
+       b_plus_destruir_nodo(raiz);
     
     return 0;
 }
 
-int b_plus_get_num_nodo(INDEXSPECS *idx)
+int b_plus_get_num_nodo(INDEX *idx)
 {
        FILE *fp;
        int num;
        
-       fp = fopen(idx->filename, "r+");
+       fp = fopen(idx->filename, "ab");
        if (fp == NULL) return -1;
     
-    num = ftell(fp)/sizeof(NODO_B_PLUS);
+    num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
+       printf("Num Nodo Nuevo: %i\n",num);
     fclose(fp);
     return num;
 }