X-Git-Url: https://git.llucax.com/z.facultad/75.06/emufs.git/blobdiff_plain/a53aa4647b26ef8543a45f1410f42123717d447f..ddc964cd151aae4713a5d2d658da986df7cd3441:/emufs/b_plus.c diff --git a/emufs/b_plus.c b/emufs/b_plus.c index bb4e564..20eac04 100644 --- a/emufs/b_plus.c +++ b/emufs/b_plus.c @@ -1,14 +1,25 @@ /** Arbol B+ */ #include "b_plus.h" +#include -/* Private prototypes */ -NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node); -NODO_B_PLUS *emufs_b_plus_crearnodo(INDEXSPECS *idx); +/**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/ +/* numerando los bloques */ +int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node); +/*NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);*/ +NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx); +int b_plus_destruir_nodo(NODO_B_PLUS *nodo); +/*int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query);*/ +int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode); +int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query); +int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query); +int b_plus_get_num_nodo(INDEXSPECS *idx); +/**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/ /** Crea un nuevo nodo y lo inicializa */ -NODO_B_PLUS *emufs_b_plus_crearnodo(INDEXSPECS *idx) { +NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx) { NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS)); + if (nodo == NULL) return NULL; nodo->nivel = 0; nodo->cant_claves = 0; @@ -26,47 +37,180 @@ int emufs_b_plus_crear(INDEXSPECS *idx) { FILE *fp; NODO_B_PLUS *raiz; + int error = 0; /* Creamos el archivo que contendra el indice */ fp = fopen(idx->filename, "w"); - PERR("Creando indice"); - fprintf(stderr, "Archivo = (%s)\n", idx->filename); + PERR("Creando indice con nodo raiz"); if (fp == NULL) { PERR("Error al crear el archivo"); return -1; } + fclose(fp); /* Creamos el nodo raiz y lo guardamos el en indice */ - raiz = emufs_b_plus_crearnodo(idx); - fwrite(raiz,SIZE_B_PLUS_HEADER,1,fp); - fwrite(raiz->claves,idx->size_claves,1,fp); - fwrite(raiz->hijos,idx->size_hijos,1,fp); - fclose(fp); + raiz = b_plus_crearnodo(idx); + error = b_plus_grabar_nodo(idx,raiz,0); /* Liberamos areas de memoria reservadas */ free(raiz->claves); free(raiz->hijos); free(raiz); + return error; +} + +/* Inserta una nueva clave y reestructura el arbol para que quede como debe */ +int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query) +{ + NODO_B_PLUS *curnode, *padre; + int i,j, prox_nodo = 0; + + /* Comienzo leyendo la raiz, entry point de toda funcion */ + curnode = b_plus_leer_nodo(idx,0); + if (curnode == NULL) return -1; + padre = curnode; + while ( curnode->nivel > 0 && curnode ) { + for(i=0; icant_claves; i++){ + /* me fijo que si es mayor */ + if ( (query->clave.i_clave > curnode->claves[i])) { + if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */ + continue; /*paso a la siguiente*/ + else { /* si era la ultima, la clave deberia ir ahi */ + /*cargo el proximo nodo*/ + prox_nodo = curnode->hijos[i+1]; + break; /*salgo del for*/ + } + } else { /*si no es mayor o igual es menor*/ + prox_nodo = curnode->hijos[i]; + break; + } + } + padre = curnode; + curnode = b_plus_leer_nodo(idx, prox_nodo); + } + /* aca tengo el nodo donde deberia ir la clave, y su padre */ + + if ( curnode->cant_claves < idx->size_claves/sizeof(int) ){ + int *claves_aux = (int*)malloc(idx->size_claves); + int *hijos_aux = (int*)malloc(idx->size_hijos); + memset(claves_aux,-1,idx->size_claves); + memset(hijos_aux,-1,idx->size_hijos); + i = 0; + while ( (curnode->claves[i] < query->clave.i_clave) && (i < curnode->cant_claves)){ + claves_aux[i] = curnode->claves[i]; + hijos_aux[i] = curnode->hijos[i]; + i++; + } + curnode->cant_claves++; + claves_aux[i] = query->clave.i_clave; + hijos_aux[i] = query->num_bloque; + for (j=i+1; jcant_claves; j++){ + claves_aux[j] = curnode->claves[j-1]; + hijos_aux[j] = curnode->hijos[j-1]; + } + free(curnode->claves); + free(curnode->hijos); + curnode->claves = claves_aux; + curnode->hijos = hijos_aux; + printf ("Prox Nodo es: %i\n",prox_nodo); + b_plus_grabar_nodo(idx, curnode, prox_nodo); + b_plus_destruir_nodo(curnode); + } + + /* si el nodo esta lleno tengo que splitear */ + if ( curnode->cant_claves == idx->size_claves ) + { + /**FIXME**/ + } return 0; } /** Busca el nro de bloque donde se debe guardar un reg con clave X */ +/** Si la clave entra en la raiz, la guarda, si no, busca el nodo hoja + donde debe ir y devuelve el bloque (en query) pero no graba la clave */ +/** Devuelve -1 si no hay un bloque donde insertar la nueva clave */ int emufs_b_plus_get_bloque(INDEXSPECS *idx, INDEX_DAT *query) { NODO_B_PLUS *curnode; - + int i, prox_nodo; /* Comienzo leyendo la raiz, entry point de toda funcion */ - printf ("Buscando donde insertar clave: %i\n",query->clave.i_clave); + printf ("Buscando donde insertar clave: %i\n\n",query->clave.i_clave); curnode = b_plus_leer_nodo(idx,0); if (curnode == NULL) return -1; - + /* Me fijo si la raiz esta vacia */ + if ( curnode->cant_claves == 0 ){ /* entra la clave en la raiz */ + /* ojo que este es un caso muy particular */ + /* aumento la cant de claves*/ + curnode->cant_claves++; + /* inserto la clave en el nodo, como es la primera no hace falta ordenar nada*/ + *(curnode->claves) = query->clave.i_clave; + /* En query->num_bloque viene un numero de bloque nuevo valido..*/ + /* Le asigno al nodo del arbol el mismo numero que venia en query*/ + *(curnode->hijos) = query->num_bloque; + /* Cargado el query salgo de la func, luego habra que actualizar el .dat */ + /*grabo el nodo en el archivo*/ + b_plus_grabar_nodo(idx, curnode, 0); + /* librero el nodo */ + b_plus_destruir_nodo(curnode); + return 0; + } + PERR("TENGO LA HOJA"); /* Mientras no encontre la hoja con la clave, busco.. */ - while ((curnode->nivel > 0) && curnode) - { - - } + /* RECORDAR QUE LAS CLAVES DEBEN ESTAR ORDENADAS PARA QUE ESTO FUNCIONE !! */ + while (curnode->nivel > 0 && curnode){ + /*recorro las claves hasta encontrar la primera mayor a la que quiero insertar*/ + for(i=0; icant_claves; i++){ + /* me fijo que si es mayor */ + if ( (query->clave.i_clave > curnode->claves[i])) { + if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */ + continue; /*paso a la siguiente*/ + else { /* si era la ultima, la clave deberia ir ahi */ + /*cargo el proximo nodo*/ + prox_nodo = curnode->hijos[i+1]; + break; /*salgo del for*/ + } + } else { /*si no es mayor o igual es menor*/ + prox_nodo = curnode->hijos[i]; + break; + } + } + b_plus_destruir_nodo(curnode); + curnode = b_plus_leer_nodo(idx, prox_nodo); + } + /*cuando salgo de aca deberia tener cargado en curnode el nodo hoja que busque*/ + for (i=0; icant_claves-1; i++){ + if ( query->clave.i_clave >= curnode->claves[i] ){ + if ( curnode->cant_claves != i ) /* si no es la ultima clave */ + continue; + else { /* si era la ultima */ + /* Cargo en query el numero del bloque donde deberia ir la nueva clave */ + query->num_bloque = curnode->hijos[i]; + b_plus_destruir_nodo(curnode); + return 0; + } + } else { /* si no era mayor, era menor */ + if ( i == 0 ){ + + /* ACA PODRIAMOS RETORNAR -1 COMO CODIGO DE ERROR QUE INFORMARIA QUE NO EXISTE + UN NODO DONDE QUEPA LA CLAVE, ENTONCES HABRIA QUE LLAMAR A LA FUNCION QUE + ACTUALIZA EL ARBOL Y SE ENCARGA DE ARGREGAR LA CLAVE Y HACER EL SPLIT DE SER + NECESARIO */ + /* Llamo a la funcion que mete una clave nueva en el arbol y le paso el bloque a donde + tiene que apuntar */ + b_plus_insertar_clave(idx, query); + b_plus_destruir_nodo(curnode); + return 1; /* SE INSERTO NODO NUEVO */ + } else { + query->num_bloque = curnode->hijos[i-1]; + b_plus_destruir_nodo(curnode); + return 0; + } + } + } + + if (curnode) b_plus_destruir_nodo(curnode); return 0; } @@ -74,24 +218,24 @@ NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) { int i = 0; FILE *fp; - NODO_B_PLUS *memnode = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS)); - char *disknode = (char*)malloc(sizeof(idx->tam_bloque)); + NODO_B_PLUS *memnode = b_plus_crearnodo(idx); + char *disknode = (char*)malloc(idx->tam_bloque); if (disknode == NULL) return NULL; if (memnode == NULL) return NULL; /* Open up file */ - fp = fopen(idx->filename, "r"); + fp = fopen(idx->filename, "r+"); if (fp == NULL) { - free(disknode); - free(memnode); + free(disknode); + b_plus_destruir_nodo(memnode); return NULL; } /* Intentamos leer un nodo, sino podemos error! */ fseek(fp, num_node*idx->tam_bloque, SEEK_SET); if (fread(disknode, idx->tam_bloque, 1, fp) != 1) { - free(disknode); + free(disknode); fclose(fp); return NULL; } @@ -100,10 +244,10 @@ NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) { /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */ memcpy(memnode,disknode,SIZE_B_PLUS_HEADER); memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves); - memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER,idx->size_hijos); + memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos); free(disknode); - printf("Dumping nodo leido...\n"); + printf("Dumping Node_%i\n",num_node); printf("Nivel: %i Cant Claves: %i\n",memnode->nivel,memnode->cant_claves); printf("Claves:"); for (i = 0; i < idx->size_claves/sizeof(int); ++i) printf(" %i",memnode->claves[i]); @@ -114,3 +258,147 @@ NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) { return memnode; } + +int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node) +{ + FILE *fp; + + fp = fopen(idx->filename, "r+"); + if (fp == NULL) return -1; + + fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET); + fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp); + fwrite(nodo->claves,idx->size_claves,1,fp); + fwrite(nodo->hijos,idx->size_hijos,1,fp); + fclose(fp); + + return 0; +} + +int b_plus_destruir_nodo(NODO_B_PLUS *nodo) +{ + free(nodo->claves); + free(nodo->hijos); + free(nodo); + return 0; +} + +int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode) +{ + /* locals */ + int minclaves = ceil(idx->size_hijos/sizeof(int)/2)-1; + int numbrother,j = 0; + int es_interno = 1; + + NODO_B_PLUS *brother = b_plus_crearnodo(idx); + brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */ + + /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */ + /* pues el ancla se debe repetir ademas de subir */ + if (brother->nivel == 0) { + brother->cant_claves = minclaves+1; + es_interno = 0; + } + else brother->cant_claves = minclaves; + + /* Copio las claves al brother derecho */ + for (j = 0; j < brother->cant_claves; ++j) + brother->claves[j] = fullnode->claves[j+minclaves+es_interno]; + + /* Copio los hijos ya sea para hoja o no hoja. Copia Chain Also! */ + for (j = 0; j < brother->cant_claves+1; ++j) + brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno]; + + /* Ahora me ocupo del nodo que se partio */ + fullnode->cant_claves = minclaves; + /* Obtengo numero de nodo para brother, para encadenar */ + numbrother = b_plus_get_num_nodo(idx); + fullnode->hijos[idx->size_hijos/sizeof(int)-1] = numbrother; + + /* Ahora fixeamos el padre, apuntando al nuevo hijo */ + for (j = parent->cant_claves; j > ithchild; --j) + parent->hijos[j+1] = parent->hijos[j]; + parent->hijos[ithchild+1] = numbrother; + + /* Idem pero subo la median key */ + for (j = parent->cant_claves-1; j >= ithchild; --j) + parent->claves[j+1] = parent->claves[j]; + parent->claves[ithchild] = fullnode->claves[minclaves]; + parent->cant_claves++; + + /* Grabo los nodos en disco */ + b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]); + b_plus_grabar_nodo(idx,brother,numbrother); + b_plus_grabar_nodo(idx,parent,numparent); + + return 0; +} + + +int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query) +{ + int i, num_nodo_hijo; + NODO_B_PLUS *hijo; + + i = nodo->cant_claves; + if ( nodo->nivel == 0 ){ + while ( i >= 1 && query->clave.i_clave < nodo->claves[i] ){ + nodo->claves[i+1] = nodo->claves[i]; + i--; + } + nodo->claves[i+1] = query->clave.i_clave; + nodo->cant_claves++; + b_plus_destruir_nodo(nodo); + b_plus_grabar_nodo(idx, nodo, num_nodo); + } else { + while ( i >= 1 && query->clave.i_clave < nodo->claves[i] ) + i--; + i++; + num_nodo_hijo = nodo->hijos[i-1]; + hijo = b_plus_leer_nodo(idx, num_nodo_hijo); + if ( hijo->cant_claves == idx->size_claves/sizeof(int) ) { + b_plus_split_child(idx, 9999, nodo, i, hijo); + if ( query->clave.i_clave > nodo->claves[i] ) + i++; + } + b_plus_insert_nonfull(idx, hijo, num_nodo_hijo, query); + } + b_plus_destruir_nodo(hijo); + return 0; +} + +int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query) +{ + NODO_B_PLUS *raiz; + + raiz = b_plus_leer_nodo(idx, 0); + if ( raiz->cant_claves == idx->size_claves/sizeof(int) ) { + NODO_B_PLUS *new_root = b_plus_crearnodo(idx); + new_root->nivel = raiz->nivel + 1; + new_root->hijos[0] = b_plus_get_num_nodo(idx); + b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]); + b_plus_grabar_nodo(idx, new_root, 0); + b_plus_split_child(idx, 0, new_root, 0, raiz); + b_plus_insert_nonfull(idx, new_root, 0, query); + } else + { + b_plus_insert_nonfull(idx, raiz, 0, query); + printf ("Entre maaaaaallll\n"); + } + + return 0; +} + +int b_plus_get_num_nodo(INDEXSPECS *idx) +{ + FILE *fp; + int num; + + fp = fopen(idx->filename, "ab"); + if (fp == NULL) return -1; + + num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos); + printf("Num Nodo Nuevo: %i\n",num); + fclose(fp); + return num; +}