X-Git-Url: https://git.llucax.com/z.facultad/75.06/emufs.git/blobdiff_plain/289dcaa6f45429b0c68e1490743b9d73d698678e..ec7edba15ba5510149162d9998bc1b7146ca249d:/emufs/b_plus.c diff --git a/emufs/b_plus.c b/emufs/b_plus.c index ab84026..a30058b 100644 --- a/emufs/b_plus.c +++ b/emufs/b_plus.c @@ -2,18 +2,18 @@ #include "b_plus.h" /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/ -/* numerando los bloques */ int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node); -/*NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);*/ +NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node); NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx); int b_plus_destruir_nodo(NODO_B_PLUS *nodo); -/*int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query);*/ -int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, int num_nodo_padre, CLAVE clave); -int b_plus_split_child(INDEXSPECS *idx,NODO_B_PLUS *new_root, int ,NODO_B_PLUS* raiz); +int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode); +int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query); +int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query); +int b_plus_get_num_nodo(INDEXSPECS *idx); /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/ /** Crea un nuevo nodo y lo inicializa */ -NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx) { +NODO_B_PLUS *b_plus_crearnodo(INDEX *idx) { NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS)); if (nodo == NULL) return NULL; @@ -57,165 +57,59 @@ int emufs_b_plus_crear(INDEXSPECS *idx) { return error; } -/* Inserta una nueva clave y reestructura el arbol para que quede como debe */ -int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query) -{ - NODO_B_PLUS *curnode, *padre, *new_nodo; - int i,j, prox_nodo; - /* Comienzo leyendo la raiz, entry point de toda funcion */ - curnode = b_plus_leer_nodo(idx,0); - if (curnode == NULL) return -1; - padre = curnode; - while ( curnode->nivel > 0 && curnode ) { - for(i=0; icant_claves; i++){ - /* me fijo que si es mayor */ - if ( (query->clave.i_clave > curnode->claves[i])) { - if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */ - continue; /*paso a la siguiente*/ - else { /* si era la ultima, la clave deberia ir ahi */ - /*cargo el proximo nodo*/ - prox_nodo = curnode->hijos[i+1]; - break; /*salgo del for*/ - } - } else { /*si no es mayor o igual es menor*/ - prox_nodo = curnode->hijos[i]; - break; - } - } - padre = curnode; - curnode = b_plus_leer_nodo(idx, prox_nodo); - } - /* aca tengo el nodo donde deberia ir la clave, y su padre */ - - if ( curnode->cant_claves < idx->size_claves/sizeof(int) ){ - int *claves_aux = (int*)malloc(idx->size_claves); - int *hijos_aux = (int*)malloc(idx->size_hijos); - memset(claves_aux,-1,idx->size_claves); - memset(hijos_aux,-1,idx->size_hijos); - i = 0; - while ( (curnode->claves[i] < query->clave.i_clave) && (i < curnode->cant_claves)){ - claves_aux[i] = curnode->claves[i]; - hijos_aux[i] = curnode->hijos[i]; - i++; - } - curnode->cant_claves++; - claves_aux[i] = query->clave.i_clave; - hijos_aux[i] = query->num_bloque; - for (j=i+1; jcant_claves; j++){ - claves_aux[j] = curnode->claves[j-1]; - hijos_aux[j] = curnode->hijos[j-1]; - } - free(curnode->claves); - free(curnode->hijos); - curnode->claves = claves_aux; - curnode->hijos = hijos_aux; - b_plus_grabar_nodo(idx, curnode, prox_nodo); - b_plus_destruir_nodo(curnode); - } - - /* si el nodo esta lleno tengo que splitear */ - if ( curnode->cant_claves == idx->size_claves ) - { - /**FIXME**/ - } - return 0; -} -/** Busca el nro de bloque donde se debe guardar un reg con clave X */ -/** Si la clave entra en la raiz, la guarda, si no, busca el nodo hoja - donde debe ir y devuelve el bloque (en query) pero no graba la clave */ -/** Devuelve -1 si no hay un bloque donde insertar la nueva clave */ -int emufs_b_plus_get_bloque(INDEXSPECS *idx, INDEX_DAT *query) { +/** Busca el nro de bloque donde se debe guardar un reg con clave X. + * Posibilidades: return 0 - Encontro un bloque potencial + * return -1 - No hay clave, inserto clave de nuevo bloques + * return 1 - Hubo falla de lectura de un nodo, Abortar + */ +int emufs_b_plus_get_bloque(INDEX *idx, INDEX_DAT *query, int num_node) { - NODO_B_PLUS *curnode; - int i, prox_nodo; - /* Comienzo leyendo la raiz, entry point de toda funcion */ - printf ("Buscando donde insertar clave: %i\n\n",query->clave.i_clave); - curnode = b_plus_leer_nodo(idx,0); - if (curnode == NULL) return -1; - /* Me fijo si la raiz esta vacia */ - if ( curnode->cant_claves == 0 ){ /* entra la clave en la raiz */ - /* ojo que este es un caso muy particular */ - /* aumento la cant de claves*/ - curnode->cant_claves++; - /* inserto la clave en el nodo, como es la primera no hace falta ordenar nada*/ - *(curnode->claves) = query->clave.i_clave; - /* En query->num_bloque viene un numero de bloque nuevo valido..*/ - /* Le asigno al nodo del arbol el mismo numero que venia en query*/ - *(curnode->hijos) = query->num_bloque; - /* Cargado el query salgo de la func, luego habra que actualizar el .dat */ - /*grabo el nodo en el archivo*/ - b_plus_grabar_nodo(idx, curnode, 0); - /* librero el nodo */ - b_plus_destruir_nodo(curnode); - return 0; - } - PERR("TENGO LA HOJA"); - /* Mientras no encontre la hoja con la clave, busco.. */ - /* RECORDAR QUE LAS CLAVES DEBEN ESTAR ORDENADAS PARA QUE ESTO FUNCIONE !! */ - while (curnode->nivel > 0 && curnode){ - /*recorro las claves hasta encontrar la primera mayor a la que quiero insertar*/ - for(i=0; icant_claves; i++){ - /* me fijo que si es mayor */ - if ( (query->clave.i_clave > curnode->claves[i])) { - if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */ - continue; /*paso a la siguiente*/ - else { /* si era la ultima, la clave deberia ir ahi */ - /*cargo el proximo nodo*/ - prox_nodo = curnode->hijos[i+1]; - break; /*salgo del for*/ - } - } else { /*si no es mayor o igual es menor*/ - prox_nodo = curnode->hijos[i]; - break; - } - } - b_plus_destruir_nodo(curnode); - curnode = b_plus_leer_nodo(idx, prox_nodo); - } + NODO_B_PLUS *nodo; + nodo = b_plus_leer_nodo(idx,num_node); + if (nodo == NULL) return 1; + int i = nodo->cant_claves - 1; + int exitcode = 0; - /*cuando salgo de aca deberia tener cargado en curnode el nodo hoja que busque*/ - for (i=0; icant_claves-1; i++){ - if ( query->clave.i_clave >= curnode->claves[i] ){ - if ( curnode->cant_claves != i ) /* si no es la ultima clave */ - continue; - else { /* si era la ultima */ - /* Cargo en query el numero del bloque donde deberia ir la nueva clave */ - query->num_bloque = curnode->hijos[i]; - b_plus_destruir_nodo(curnode); - return 0; - } - } else { /* si no era mayor, era menor */ - if ( i == 0 ){ - - /* ACA PODRIAMOS RETORNAR -1 COMO CODIGO DE ERROR QUE INFORMARIA QUE NO EXISTE - UN NODO DONDE QUEPA LA CLAVE, ENTONCES HABRIA QUE LLAMAR A LA FUNCION QUE - ACTUALIZA EL ARBOL Y SE ENCARGA DE ARGREGAR LA CLAVE Y HACER EL SPLIT DE SER - NECESARIO */ - /* Llamo a la funcion que mete una clave nueva en el arbol y le paso el bloque a donde - tiene que apuntar */ - b_plus_insertar_clave(idx, query); - b_plus_destruir_nodo(curnode); - return 1; /* SE INSERTO NODO NUEVO */ - } else { - query->num_bloque = curnode->hijos[i-1]; - b_plus_destruir_nodo(curnode); - return 0; - } + /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */ + if (nodo->nivel == 0) { + /* Vemos en que bloque deberia ir */ + while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) i--; + if (i < 0) { + /* La clave es menor que todas, debo insertarla */ + b_plus_destruir_nodo(nodo); + emufs_b_plus_insertar(idx,query); + return -1; + } + else { + /* Encontre un bloque potencial */ + query->num_bloque = nodo->hijos[i]; + b_plus_destruir_nodo(nodo); + return 0; } } - - if (curnode) b_plus_destruir_nodo(curnode); - return 0; + else { + /* Buscamos por donde descender al siguiente nivel */ + while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) i--; + i++; + num_node = nodo->hijos[i]; + b_plus_destruir_nodo(nodo); + exitcode = emufs_b_plus_get_bloque(idx,query,num_node); + return exitcode; + } } -NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) { +NODO_B_PLUS *b_plus_leer_nodo(INDEX *idx, int num_node) { - int i = 0; + /*int i = 0;*/ FILE *fp; NODO_B_PLUS *memnode = b_plus_crearnodo(idx); char *disknode = (char*)malloc(idx->tam_bloque); + if (num_node < 0) { + PERR("Se intento leer nodo negativo!!\n"); + exit(1); + } if (disknode == NULL) return NULL; if (memnode == NULL) return NULL; @@ -242,26 +136,26 @@ NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) { memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos); free(disknode); - printf("Dumping Node_%i\n",num_node); + /*printf("Dumping Node_%i\n",num_node); printf("Nivel: %i Cant Claves: %i\n",memnode->nivel,memnode->cant_claves); printf("Claves:"); for (i = 0; i < idx->size_claves/sizeof(int); ++i) printf(" %i",memnode->claves[i]); printf("\nHijos:"); for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]); - printf("\nEnd Dump\n"); + printf("\nEnd Dump\n"); */ return memnode; } -int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node) +int b_plus_grabar_nodo(INDEX *idx, NODO_B_PLUS *nodo, int num_node) { FILE *fp; fp = fopen(idx->filename, "r+"); if (fp == NULL) return -1; - fseek(fp,num_node*sizeof(NODO_B_PLUS),SEEK_SET); + fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET); fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp); fwrite(nodo->claves,idx->size_claves,1,fp); fwrite(nodo->hijos,idx->size_hijos,1,fp); @@ -278,39 +172,98 @@ int b_plus_destruir_nodo(NODO_B_PLUS *nodo) return 0; } -int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, int num_nodo_padre, CLAVE clave) +int b_plus_split_child(INDEX *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode) +{ + /* locals */ + int minclaves = ceil(idx->size_hijos/sizeof(int)/2)-1; + int numbrother,j = 0; + int es_interno = 1; + + NODO_B_PLUS *brother = b_plus_crearnodo(idx); + brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */ + + /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */ + /* pues el ancla se debe repetir ademas de subir */ + if (brother->nivel == 0) { + brother->cant_claves = minclaves+1; + es_interno = 0; + } + else brother->cant_claves = minclaves; + + /* Copio las claves al brother derecho */ + for (j = 0; j < brother->cant_claves; ++j) + brother->claves[j] = fullnode->claves[j+minclaves+es_interno]; + + /* Copio los hijos ya sea para hoja o no hoja. */ + for (j = 0; j < brother->cant_claves+1; ++j) + brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno]; + + /* Ahora me ocupo del nodo que se partio */ + fullnode->cant_claves = minclaves; + /* Obtengo numero de nodo para brother y encadeno si es hoja */ + numbrother = b_plus_get_num_nodo(idx); + if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother; + + /* Ahora fixeamos el padre, apuntando al nuevo hijo */ + for (j = parent->cant_claves; j > ithchild; --j) + parent->hijos[j+1] = parent->hijos[j]; + parent->hijos[ithchild+1] = numbrother; + + /* Idem pero subo la median key */ + for (j = parent->cant_claves-1; j >= ithchild; --j) + parent->claves[j+1] = parent->claves[j]; + parent->claves[ithchild] = fullnode->claves[minclaves]; + parent->cant_claves++; + + /* Grabo los nodos en disco */ + b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]); + b_plus_grabar_nodo(idx,brother,numbrother); + b_plus_grabar_nodo(idx,parent,numparent); + + b_plus_destruir_nodo(brother); + + return 0; +} + + +int b_plus_insert_nonfull(INDEX *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query) { int i, num_nodo_hijo; NODO_B_PLUS *hijo; - i = nodo->cant_claves; + i = nodo->cant_claves-1; if ( nodo->nivel == 0 ){ - while ( i >= 1 && clave.i_clave < nodo->claves[i] ){ + while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ){ nodo->claves[i+1] = nodo->claves[i]; + nodo->hijos[i+2] = nodo->hijos[i+1]; + nodo->hijos[i+1] = nodo->hijos[i]; i--; } - nodo->claves[i+1] = clave.i_clave; + nodo->claves[i+1] = query->clave.i_clave; + nodo->hijos[i+1] = query->num_bloque; nodo->cant_claves++; - b_plus_destruir_nodo(nodo); b_plus_grabar_nodo(idx, nodo, num_nodo); } else { - while ( i >= 1 && clave.i_clave < nodo->claves[i] ) + while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) i--; i++; - num_nodo_hijo = nodo->hijos[i-1]; + num_nodo_hijo = nodo->hijos[i]; hijo = b_plus_leer_nodo(idx, num_nodo_hijo); if ( hijo->cant_claves == idx->size_claves/sizeof(int) ) { - b_plus_split_child(idx, nodo, i, hijo); - if ( clave.i_clave > nodo->claves[i] ) + b_plus_split_child(idx, num_nodo, nodo, i, hijo); + if ( query->clave.i_clave > nodo->claves[i] ) i++; } - b_plus_insert_nonfull(idx, hijo, num_nodo_hijo, num_nodo_padre); + if (hijo) b_plus_destruir_nodo(hijo); + hijo = b_plus_leer_nodo(idx, nodo->hijos[i]); + b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query); + if (hijo) b_plus_destruir_nodo(hijo); } - b_plus_destruir_nodo(hijo); - return 0; + + return 0; } -int b_tree_insertar(INDEXSPECS *idx, CLAVE clave) +int emufs_b_plus_insertar(INDEX *idx, INDEX_DAT *query) { NODO_B_PLUS *raiz; @@ -321,22 +274,29 @@ int b_tree_insertar(INDEXSPECS *idx, CLAVE clave) new_root->hijos[0] = b_plus_get_num_nodo(idx); b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]); b_plus_grabar_nodo(idx, new_root, 0); - b_plus_split_child(idx, new_root, 1, raiz); - b_plus_insert_nonfull(idx, new_root, 0, clave); - } else b_plus_insert_nonfull(idx, raiz, 0, clave); + b_plus_split_child(idx, 0, new_root, 0, raiz); + b_plus_insert_nonfull(idx, new_root, 0, query); + b_plus_destruir_nodo(new_root); + } else + { + b_plus_insert_nonfull(idx, raiz, 0, query); + } + + b_plus_destruir_nodo(raiz); return 0; } -int b_plus_get_num_nodo(INDEXSPECS *idx) +int b_plus_get_num_nodo(INDEX *idx) { FILE *fp; int num; - fp = fopen(idx->filename, "r+"); + fp = fopen(idx->filename, "ab"); if (fp == NULL) return -1; - num = ftell(fp)/sizeof(NODO_B_PLUS); + num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos); + printf("Num Nodo Nuevo: %i\n",num); fclose(fp); return num; }