/** Arbol B+ */
#include "b_plus.h"
+#include <math.h>
-/* Private prototypes */
-NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);
-NODO_B_PLUS *emufs_b_plus_crearnodo(INDEXSPECS *idx);
+/**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
+/* numerando los bloques */
+int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node);
+/*NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);*/
+NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx);
+int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
+/*int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query);*/
+int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
+int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
+int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query);
+int b_plus_get_num_nodo(INDEXSPECS *idx);
+/**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
/** Crea un nuevo nodo y lo inicializa */
-NODO_B_PLUS *emufs_b_plus_crearnodo(INDEXSPECS *idx) {
+NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx) {
NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
+ if (nodo == NULL) return NULL;
nodo->nivel = 0;
nodo->cant_claves = 0;
FILE *fp;
NODO_B_PLUS *raiz;
+ int error = 0;
/* Creamos el archivo que contendra el indice */
fp = fopen(idx->filename, "w");
- PERR("Creando indice");
- fprintf(stderr, "Archivo = (%s)\n", idx->filename);
+ PERR("Creando indice con nodo raiz");
if (fp == NULL) {
PERR("Error al crear el archivo");
return -1;
}
+ fclose(fp);
/* Creamos el nodo raiz y lo guardamos el en indice */
- raiz = emufs_b_plus_crearnodo(idx);
- fwrite(raiz,SIZE_B_PLUS_HEADER,1,fp);
- fwrite(raiz->claves,idx->size_claves,1,fp);
- fwrite(raiz->hijos,idx->size_hijos,1,fp);
- fclose(fp);
+ raiz = b_plus_crearnodo(idx);
+ error = b_plus_grabar_nodo(idx,raiz,0);
/* Liberamos areas de memoria reservadas */
free(raiz->claves);
free(raiz->hijos);
free(raiz);
+ return error;
+}
+
+/* Inserta una nueva clave y reestructura el arbol para que quede como debe */
+int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query)
+{
+ NODO_B_PLUS *curnode, *padre;
+ int i,j, prox_nodo = 0;
+
+ /* Comienzo leyendo la raiz, entry point de toda funcion */
+ curnode = b_plus_leer_nodo(idx,0);
+ if (curnode == NULL) return -1;
+ padre = curnode;
+ while ( curnode->nivel > 0 && curnode ) {
+ for(i=0; i<curnode->cant_claves; i++){
+ /* me fijo que si es mayor */
+ if ( (query->clave.i_clave > curnode->claves[i])) {
+ if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
+ continue; /*paso a la siguiente*/
+ else { /* si era la ultima, la clave deberia ir ahi */
+ /*cargo el proximo nodo*/
+ prox_nodo = curnode->hijos[i+1];
+ break; /*salgo del for*/
+ }
+ } else { /*si no es mayor o igual es menor*/
+ prox_nodo = curnode->hijos[i];
+ break;
+ }
+ }
+ padre = curnode;
+ curnode = b_plus_leer_nodo(idx, prox_nodo);
+ }
+ /* aca tengo el nodo donde deberia ir la clave, y su padre */
+
+ if ( curnode->cant_claves < idx->size_claves/sizeof(int) ){
+ int *claves_aux = (int*)malloc(idx->size_claves);
+ int *hijos_aux = (int*)malloc(idx->size_hijos);
+ memset(claves_aux,-1,idx->size_claves);
+ memset(hijos_aux,-1,idx->size_hijos);
+ i = 0;
+ while ( (curnode->claves[i] < query->clave.i_clave) && (i < curnode->cant_claves)){
+ claves_aux[i] = curnode->claves[i];
+ hijos_aux[i] = curnode->hijos[i];
+ i++;
+ }
+ curnode->cant_claves++;
+ claves_aux[i] = query->clave.i_clave;
+ hijos_aux[i] = query->num_bloque;
+ for (j=i+1; j<curnode->cant_claves; j++){
+ claves_aux[j] = curnode->claves[j-1];
+ hijos_aux[j] = curnode->hijos[j-1];
+ }
+ free(curnode->claves);
+ free(curnode->hijos);
+ curnode->claves = claves_aux;
+ curnode->hijos = hijos_aux;
+ printf ("Prox Nodo es: %i\n",prox_nodo);
+ b_plus_grabar_nodo(idx, curnode, prox_nodo);
+ b_plus_destruir_nodo(curnode);
+ }
+
+ /* si el nodo esta lleno tengo que splitear */
+ if ( curnode->cant_claves == idx->size_claves )
+ {
+ /**FIXME**/
+ }
return 0;
}
/** Busca el nro de bloque donde se debe guardar un reg con clave X */
+/** Si la clave entra en la raiz, la guarda, si no, busca el nodo hoja
+ donde debe ir y devuelve el bloque (en query) pero no graba la clave */
+/** Devuelve -1 si no hay un bloque donde insertar la nueva clave */
int emufs_b_plus_get_bloque(INDEXSPECS *idx, INDEX_DAT *query) {
NODO_B_PLUS *curnode;
-
+ int i, prox_nodo;
/* Comienzo leyendo la raiz, entry point de toda funcion */
- printf ("Buscando donde insertar clave: %i\n",query->clave.i_clave);
+ printf ("Buscando donde insertar clave: %i\n\n",query->clave.i_clave);
curnode = b_plus_leer_nodo(idx,0);
if (curnode == NULL) return -1;
-
+ /* Me fijo si la raiz esta vacia */
+ if ( curnode->cant_claves == 0 ){ /* entra la clave en la raiz */
+ /* ojo que este es un caso muy particular */
+ /* aumento la cant de claves*/
+ curnode->cant_claves++;
+ /* inserto la clave en el nodo, como es la primera no hace falta ordenar nada*/
+ *(curnode->claves) = query->clave.i_clave;
+ /* En query->num_bloque viene un numero de bloque nuevo valido..*/
+ /* Le asigno al nodo del arbol el mismo numero que venia en query*/
+ *(curnode->hijos) = query->num_bloque;
+ /* Cargado el query salgo de la func, luego habra que actualizar el .dat */
+ /*grabo el nodo en el archivo*/
+ b_plus_grabar_nodo(idx, curnode, 0);
+ /* librero el nodo */
+ b_plus_destruir_nodo(curnode);
+ return 0;
+ }
+ PERR("TENGO LA HOJA");
/* Mientras no encontre la hoja con la clave, busco.. */
- while ((curnode->nivel > 0) && curnode)
- {
-
- }
+ /* RECORDAR QUE LAS CLAVES DEBEN ESTAR ORDENADAS PARA QUE ESTO FUNCIONE !! */
+ while (curnode->nivel > 0 && curnode){
+ /*recorro las claves hasta encontrar la primera mayor a la que quiero insertar*/
+ for(i=0; i<curnode->cant_claves; i++){
+ /* me fijo que si es mayor */
+ if ( (query->clave.i_clave > curnode->claves[i])) {
+ if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
+ continue; /*paso a la siguiente*/
+ else { /* si era la ultima, la clave deberia ir ahi */
+ /*cargo el proximo nodo*/
+ prox_nodo = curnode->hijos[i+1];
+ break; /*salgo del for*/
+ }
+ } else { /*si no es mayor o igual es menor*/
+ prox_nodo = curnode->hijos[i];
+ break;
+ }
+ }
+ b_plus_destruir_nodo(curnode);
+ curnode = b_plus_leer_nodo(idx, prox_nodo);
+ }
+ /*cuando salgo de aca deberia tener cargado en curnode el nodo hoja que busque*/
+ for (i=0; i<curnode->cant_claves-1; i++){
+ if ( query->clave.i_clave >= curnode->claves[i] ){
+ if ( curnode->cant_claves != i ) /* si no es la ultima clave */
+ continue;
+ else { /* si era la ultima */
+ /* Cargo en query el numero del bloque donde deberia ir la nueva clave */
+ query->num_bloque = curnode->hijos[i];
+ b_plus_destruir_nodo(curnode);
+ return 0;
+ }
+ } else { /* si no era mayor, era menor */
+ if ( i == 0 ){
+
+ /* ACA PODRIAMOS RETORNAR -1 COMO CODIGO DE ERROR QUE INFORMARIA QUE NO EXISTE
+ UN NODO DONDE QUEPA LA CLAVE, ENTONCES HABRIA QUE LLAMAR A LA FUNCION QUE
+ ACTUALIZA EL ARBOL Y SE ENCARGA DE ARGREGAR LA CLAVE Y HACER EL SPLIT DE SER
+ NECESARIO */
+ /* Llamo a la funcion que mete una clave nueva en el arbol y le paso el bloque a donde
+ tiene que apuntar */
+ b_plus_insertar_clave(idx, query);
+ b_plus_destruir_nodo(curnode);
+ return 1; /* SE INSERTO NODO NUEVO */
+ } else {
+ query->num_bloque = curnode->hijos[i-1];
+ b_plus_destruir_nodo(curnode);
+ return 0;
+ }
+ }
+ }
+
+ if (curnode) b_plus_destruir_nodo(curnode);
return 0;
}
int i = 0;
FILE *fp;
- NODO_B_PLUS *memnode = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
- char *disknode = (char*)malloc(sizeof(idx->tam_bloque));
+ NODO_B_PLUS *memnode = b_plus_crearnodo(idx);
+ char *disknode = (char*)malloc(idx->tam_bloque);
+ if (num_node < 0) {
+ PERR("Se intento leer nodo negativo!!\n");
+ exit(1);
+ }
if (disknode == NULL) return NULL;
if (memnode == NULL) return NULL;
/* Open up file */
- fp = fopen(idx->filename, "r");
+ fp = fopen(idx->filename, "r+");
if (fp == NULL) {
- free(disknode);
- free(memnode);
+ free(disknode);
+ b_plus_destruir_nodo(memnode);
return NULL;
}
/* Intentamos leer un nodo, sino podemos error! */
fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
- free(disknode);
+ free(disknode);
fclose(fp);
return NULL;
}
/* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
- memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER,idx->size_hijos);
+ memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
free(disknode);
- printf("Dumping nodo leido...\n");
+ printf("Dumping Node_%i\n",num_node);
printf("Nivel: %i Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
printf("Claves:");
for (i = 0; i < idx->size_claves/sizeof(int); ++i) printf(" %i",memnode->claves[i]);
return memnode;
}
+
+int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node)
+{
+ FILE *fp;
+
+ fp = fopen(idx->filename, "r+");
+ if (fp == NULL) return -1;
+
+ fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);
+ fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
+ fwrite(nodo->claves,idx->size_claves,1,fp);
+ fwrite(nodo->hijos,idx->size_hijos,1,fp);
+ fclose(fp);
+
+ return 0;
+}
+
+int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
+{
+ free(nodo->claves);
+ free(nodo->hijos);
+ free(nodo);
+ return 0;
+}
+
+int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
+{
+ /* locals */
+ int minclaves = ceil(idx->size_hijos/sizeof(int)/2)-1;
+ int maxhijos = idx->size_hijos/sizeof(int);
+ int numbrother,j = 0;
+ int es_interno = 1;
+
+ NODO_B_PLUS *brother = b_plus_crearnodo(idx);
+ brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
+
+ /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
+ /* pues el ancla se debe repetir ademas de subir */
+ if (brother->nivel == 0) {
+ brother->cant_claves = minclaves+1;
+ es_interno = 0;
+ }
+ else brother->cant_claves = minclaves;
+
+ /* Copio las claves al brother derecho */
+ for (j = 0; j < brother->cant_claves; ++j)
+ brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
+
+ /* Copio los hijos ya sea para hoja o no hoja. */
+ for (j = 0; j < brother->cant_claves+1; ++j)
+ brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
+
+ /* Ahora me ocupo del nodo que se partio */
+ fullnode->cant_claves = minclaves;
+ /* Obtengo numero de nodo para brother y encadeno si es hoja */
+ numbrother = b_plus_get_num_nodo(idx);
+ if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
+
+ /* Ahora fixeamos el padre, apuntando al nuevo hijo */
+ for (j = parent->cant_claves; j > ithchild; --j)
+ parent->hijos[j+1] = parent->hijos[j];
+ parent->hijos[ithchild+1] = numbrother;
+
+ /* Idem pero subo la median key */
+ for (j = parent->cant_claves-1; j >= ithchild; --j)
+ parent->claves[j+1] = parent->claves[j];
+ parent->claves[ithchild] = fullnode->claves[minclaves];
+ parent->cant_claves++;
+
+ /* Grabo los nodos en disco */
+ b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
+ b_plus_grabar_nodo(idx,brother,numbrother);
+ b_plus_grabar_nodo(idx,parent,numparent);
+
+ b_plus_destruir_nodo(brother);
+
+ return 0;
+}
+
+
+int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
+{
+ int i, num_nodo_hijo;
+ NODO_B_PLUS *hijo;
+
+ i = nodo->cant_claves-1;
+ if ( nodo->nivel == 0 ){
+ while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ){
+ nodo->claves[i+1] = nodo->claves[i];
+ nodo->hijos[i+1] = nodo->hijos[i];
+ i--;
+ }
+ nodo->claves[i+1] = query->clave.i_clave;
+ nodo->hijos[i+1] = query->num_bloque;
+ nodo->cant_claves++;
+ b_plus_grabar_nodo(idx, nodo, num_nodo);
+ } else {
+ while ( i >= 0 && query->clave.i_clave < nodo->claves[i] )
+ i--;
+ i++;
+ num_nodo_hijo = nodo->hijos[i];
+ hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
+ if ( hijo->cant_claves == idx->size_claves/sizeof(int) ) {
+ b_plus_split_child(idx, num_nodo, nodo, i, hijo);
+ if ( query->clave.i_clave > nodo->claves[i] )
+ i++;
+ }
+ if (hijo) b_plus_destruir_nodo(hijo);
+ hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
+ b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
+ if (hijo) b_plus_destruir_nodo(hijo);
+ }
+
+ return 0;
+}
+
+int emufs_b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query)
+{
+ NODO_B_PLUS *raiz;
+
+ raiz = b_plus_leer_nodo(idx, 0);
+ if ( raiz->cant_claves == idx->size_claves/sizeof(int) ) {
+ NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
+ new_root->nivel = raiz->nivel + 1;
+ new_root->hijos[0] = b_plus_get_num_nodo(idx);
+ b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
+ b_plus_grabar_nodo(idx, new_root, 0);
+ b_plus_split_child(idx, 0, new_root, 0, raiz);
+ b_plus_insert_nonfull(idx, new_root, 0, query);
+ b_plus_destruir_nodo(new_root);
+ } else
+ {
+ b_plus_insert_nonfull(idx, raiz, 0, query);
+ }
+
+ b_plus_destruir_nodo(raiz);
+
+ return 0;
+}
+
+int b_plus_get_num_nodo(INDEXSPECS *idx)
+{
+ FILE *fp;
+ int num;
+
+ fp = fopen(idx->filename, "ab");
+ if (fp == NULL) return -1;
+
+ num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
+ printf("Num Nodo Nuevo: %i\n",num);
+ fclose(fp);
+ return num;
+}