]> git.llucax.com Git - z.facultad/75.06/emufs.git/blobdiff - emufs/b_plus.c
Algunos bugfixes, siguiendo con claves multiples y recuperacion de strings
[z.facultad/75.06/emufs.git] / emufs / b_plus.c
index 7e2fa16c832dba97b8a0d9f9f4d49ec20c04043e..61e7b4ccd4609e3ad0fe9c011bf1d2c8b6fe8c5b 100644 (file)
 /** Arbol B+ */
 #include "b_plus.h"
 
 /** Arbol B+ */
 #include "b_plus.h"
 
+/**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
+/* numerando los bloques */
+int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node);
+/*NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);*/
+NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx);
+int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
+/*int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query);*/
+
+/**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
+
 /** Crea un nuevo nodo y lo inicializa */
 /** Crea un nuevo nodo y lo inicializa */
-NODO_B_PLUS emufs_b_plus_crearnodo(INDICE *idx, int es_hoja) {
-       
-       NODO_B_PLUS nodo;
-       int nonheader_bytes = 0;
-       int size_claves = 0;
-       int size_hijos = 0;
+NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx) {
        
        
-       nodo.es_hoja = es_hoja;
-       nodo.nivel = 0;
-       nodo.cant_claves = 0;
+       NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
+       if (nodo == NULL) return NULL;
+       nodo->nivel = 0;
+       nodo->cant_claves = 0;
 
     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
 
     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
-       nonheader_bytes = idx->tam_bloque - sizeof(int)*3;      
-       size_claves = (nonheader_bytes - sizeof(int))/2;
-       size_hijos = size_claves + sizeof(int);
-       nodo.claves = (int*) malloc(size_claves);
-       nodo.hijos = (int*) malloc(size_hijos);
-       memset(nodo.claves,'1',size_claves);
-       memset(nodo.hijos,'9',size_hijos);
+       nodo->claves = (int*)malloc(idx->size_claves);
+       nodo->hijos = (int*)malloc(idx->size_hijos);
+       memset(nodo->claves,-1,idx->size_claves);
+       memset(nodo->hijos,-1,idx->size_hijos);
        
     return nodo;       
 }
 
 /** Crea el archivo indice B+ */
        
     return nodo;       
 }
 
 /** Crea el archivo indice B+ */
-int emufs_b_plus_crear(INDICE *idx) {
+int emufs_b_plus_crear(INDEXSPECS *idx) {
        
        FILE *fp;
        
        FILE *fp;
-       NODO_B_PLUS raiz;
-       int size_claves = (idx->tam_bloque - SIZE_B_PLUS_HEADER - sizeof(int))/2;
-       int size_hijos = size_claves + sizeof(int);
+       NODO_B_PLUS *raiz;
+       int error = 0;
                
        /* Creamos el archivo que contendra el indice */
        fp = fopen(idx->filename, "w");
                
        /* Creamos el archivo que contendra el indice */
        fp = fopen(idx->filename, "w");
-       PERR("Creando indice");
-       fprintf(stderr, "Archivo = (%s)\n", idx->filename);
+       PERR("Creando indice con nodo raiz");
        if (fp == NULL) {
                PERR("Error al crear el archivo");
                return -1;
        }
        if (fp == NULL) {
                PERR("Error al crear el archivo");
                return -1;
        }
+       fclose(fp);
        
        /* Creamos el nodo raiz y lo guardamos el en indice */
        
        /* Creamos el nodo raiz y lo guardamos el en indice */
-       raiz = emufs_b_plus_crearnodo(idx,0);
-       fwrite(&raiz,SIZE_B_PLUS_HEADER,1,fp);
-       fwrite(raiz.claves,size_claves,1,fp);
-       fwrite(raiz.hijos,size_hijos,1,fp);
+       raiz = b_plus_crearnodo(idx);
+       error = b_plus_grabar_nodo(idx,raiz,0);
+       
+       /* Liberamos areas de memoria reservadas */
+       free(raiz->claves);
+       free(raiz->hijos);
+       free(raiz);
+       
+       return error;
+}
+
+/* Inserta una nueva clave y reestructura el arbol para que quede como debe */
+int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query)
+{
+       NODO_B_PLUS *curnode, *padre, *new_nodo;
+       int i,j, prox_nodo;
+       /* Comienzo leyendo la raiz, entry point de toda funcion */
+       curnode = b_plus_leer_nodo(idx,0);      
+       if (curnode == NULL) return -1;
+       padre = curnode;
+       while ( curnode->nivel > 0 && curnode ) {
+               for(i=0; i<curnode->cant_claves; i++){ 
+                       /* me fijo que si es mayor */
+                       if ( (query->clave.i_clave > curnode->claves[i])) {
+                               if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
+                                       continue; /*paso a la siguiente*/
+                               else {  /* si era la ultima, la clave deberia ir ahi */
+                                       /*cargo el proximo nodo*/
+                                       prox_nodo = curnode->hijos[i+1];
+                                       break; /*salgo del for*/
+                               }
+                       } else {  /*si no es mayor o igual es menor*/
+                               prox_nodo = curnode->hijos[i];
+                               break;
+                       }
+               }
+               padre = curnode;
+               curnode = b_plus_leer_nodo(idx, prox_nodo);
+       } 
+       /* aca tengo el nodo donde deberia ir la clave, y su padre */ 
+       
+       if ( curnode->cant_claves < idx->size_claves/sizeof(int) ){
+               int *claves_aux = (int*)malloc(idx->size_claves);
+               int *hijos_aux = (int*)malloc(idx->size_hijos);
+               memset(claves_aux,-1,idx->size_claves);
+               memset(hijos_aux,-1,idx->size_hijos);
+               i = 0;
+               while ( (curnode->claves[i] < query->clave.i_clave) && (i < curnode->cant_claves)){
+                       claves_aux[i] = curnode->claves[i];
+                       hijos_aux[i] = curnode->hijos[i];
+                       i++;
+               }
+               curnode->cant_claves++;
+               claves_aux[i] = query->clave.i_clave;
+               hijos_aux[i] = query->num_bloque;
+               for (j=i+1; j<curnode->cant_claves; j++){
+                       claves_aux[j] = curnode->claves[j-1];
+                       hijos_aux[j] = curnode->hijos[j-1];
+               }
+               free(curnode->claves);
+               free(curnode->hijos);
+               curnode->claves = claves_aux;
+               curnode->hijos = hijos_aux;
+               b_plus_grabar_nodo(idx, curnode, prox_nodo);
+               b_plus_destruir_nodo(curnode);
+       }
+               
+       /* si el nodo esta lleno tengo que splitear */
+       if ( curnode->cant_claves == idx->size_claves ) 
+       {
+               /**FIXME**/
+       }
+       return 0;
+}
+
+/** Busca el nro de bloque donde se debe guardar un reg con clave X */
+/** Si la clave entra en la raiz, la guarda, si no, busca el nodo hoja
+    donde debe ir y devuelve el bloque (en query) pero no graba la clave */
+/** Devuelve -1 si no hay un bloque donde insertar la nueva clave */
+int emufs_b_plus_get_bloque(INDEXSPECS *idx, INDEX_DAT *query) {
+
+    NODO_B_PLUS *curnode;
+       int i, prox_nodo;
+       /* Comienzo leyendo la raiz, entry point de toda funcion */
+       printf ("Buscando donde insertar clave: %i\n\n",query->clave.i_clave);
+       curnode = b_plus_leer_nodo(idx,0);      
+       if (curnode == NULL) return -1;
+       /* Me fijo si la raiz esta vacia */
+       if ( curnode->cant_claves == 0 ){ /* entra la clave en la raiz */ 
+               /* ojo que este es un caso muy particular */
+               /* aumento la cant de claves*/
+               curnode->cant_claves++;
+               /* inserto la clave en el nodo, como es la primera no hace falta ordenar nada*/
+               *(curnode->claves) = query->clave.i_clave;
+               /* En query->num_bloque viene un numero de bloque nuevo valido..*/
+               /* Le asigno al nodo del arbol el mismo numero que venia en query*/
+               *(curnode->hijos) = query->num_bloque;
+               /* Cargado el query salgo de la func, luego habra que actualizar el .dat */
+               /*grabo el nodo en el archivo*/
+               b_plus_grabar_nodo(idx, curnode, 0);
+               /* librero el nodo */
+               b_plus_destruir_nodo(curnode);
+               return 0;
+       } 
+       PERR("TENGO LA HOJA");  
+       /* Mientras no encontre la hoja con la clave, busco.. */
+       /* RECORDAR QUE LAS CLAVES DEBEN ESTAR ORDENADAS PARA QUE ESTO FUNCIONE !! */ 
+       while (curnode->nivel > 0 && curnode){  
+               /*recorro las claves hasta encontrar la primera mayor a la que quiero insertar*/
+               for(i=0; i<curnode->cant_claves; i++){ 
+                       /* me fijo que si es mayor */
+                       if ( (query->clave.i_clave > curnode->claves[i])) {
+                               if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
+                                       continue; /*paso a la siguiente*/
+                               else {  /* si era la ultima, la clave deberia ir ahi */
+                                       /*cargo el proximo nodo*/
+                                       prox_nodo = curnode->hijos[i+1];
+                                       break; /*salgo del for*/
+                               }
+                       } else {  /*si no es mayor o igual es menor*/
+                               prox_nodo = curnode->hijos[i];
+                               break;
+                       }
+               }
+               b_plus_destruir_nodo(curnode);
+               curnode = b_plus_leer_nodo(idx, prox_nodo);
+       } 
+       
+       /*cuando salgo de aca deberia tener cargado en curnode el nodo hoja que busque*/
+       for (i=0; i<curnode->cant_claves-1; i++){
+               if ( query->clave.i_clave >= curnode->claves[i] ){
+                       if ( curnode->cant_claves != i ) /* si no es la ultima clave */
+                               continue;
+                       else {   /* si era la ultima */
+                               /* Cargo en query el numero del bloque donde deberia ir la nueva clave */
+                               query->num_bloque = curnode->hijos[i];
+                               b_plus_destruir_nodo(curnode);
+                               return 0;
+                       }
+               } else {  /* si no era mayor, era menor */
+                       if ( i == 0 ){ 
+                                                               
+                               /* ACA PODRIAMOS RETORNAR -1 COMO CODIGO DE ERROR QUE INFORMARIA QUE NO EXISTE 
+                                  UN NODO DONDE QUEPA LA CLAVE, ENTONCES HABRIA QUE LLAMAR A LA FUNCION QUE
+                                  ACTUALIZA EL ARBOL Y SE ENCARGA DE ARGREGAR LA CLAVE Y HACER EL SPLIT DE SER 
+                                  NECESARIO */
+                               /* Llamo a la funcion que mete una clave nueva en el arbol y le paso el bloque a donde 
+                                  tiene que apuntar */
+                               b_plus_insertar_clave(idx, query);
+                               b_plus_destruir_nodo(curnode);
+                               return 1; /* SE INSERTO NODO NUEVO */
+                       } else {
+                               query->num_bloque = curnode->hijos[i-1];
+                               b_plus_destruir_nodo(curnode);
+                               return 0;
+                       }
+               }
+       }
+
+       if (curnode) b_plus_destruir_nodo(curnode);
+       return 0;
+}
+
+NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) {
+
+       int i = 0;
+       FILE *fp;
+       NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
+       char *disknode = (char*)malloc(idx->tam_bloque);
+       
+       if (disknode == NULL) return NULL;
+       if (memnode == NULL) return NULL;
+       
+    /* Open up file */
+       fp = fopen(idx->filename, "r+");
+       if (fp == NULL) {
+               free(disknode);
+               b_plus_destruir_nodo(memnode);
+               return NULL;
+       }
+
+       /* Intentamos leer un nodo, sino podemos error! */
+       fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
+       if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
+               free(disknode);
+               fclose(fp);
+               return NULL;
+       }
        fclose(fp);
        
        fclose(fp);
        
-       /* Liberamos areas de memoria reservadas para claves e hijos */
-       free(raiz.claves);
-       free(raiz.hijos);
+       /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
+       memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
+       memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
+       memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
+       free(disknode);
+       
+       printf("Dumping Node_%i\n",num_node);
+       printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
+       printf("Claves:");
+       for (i = 0; i < idx->size_claves/sizeof(int); ++i) printf(" %i",memnode->claves[i]);
+       printf("\nHijos:");
+       for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
+       printf("\nEnd Dump\n"); 
+       
+       return memnode;
+       
+}
+
+int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node)
+{
+       FILE *fp;
+       
+       fp = fopen(idx->filename, "r+");
+       if (fp == NULL) return -1;
+               
+       fseek(fp,num_node*sizeof(NODO_B_PLUS),SEEK_SET);        
+       fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
+       fwrite(nodo->claves,idx->size_claves,1,fp);
+       fwrite(nodo->hijos,idx->size_hijos,1,fp);
+       fclose(fp);
        
        return 0;
 }
 
        
        return 0;
 }
 
-/** Inserta una clave en el arbol */
-INDEX_DAT emufs_b_plus_insertar(CLAVE clave)
+int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
 {
 {
-       INDEX_DAT insertado;
+       free(nodo->claves);
+       free(nodo->hijos);
+       free(nodo);
+       return 0;
+}