3 #include "indice_bplus.h"
5 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
6 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node);
7 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node);
8 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
11 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
12 int b_plus_insertar(INDICE *idx, INDEX_DAT *query);
13 int b_plus_get_num_nodo(INDICE *idx);
14 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
16 /** Crea un nuevo nodo y lo inicializa */
17 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx) {
19 NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
20 if (nodo == NULL) return NULL;
22 nodo->cant_claves = 0;
24 /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
25 nodo->claves = (CLAVE*)malloc(idx->size_claves);
26 nodo->hijos = (int*)malloc(idx->size_hijos);
27 memset(nodo->claves,-1,idx->size_claves);
28 memset(nodo->hijos,-1,idx->size_hijos);
33 /** Crea el archivo indice B+ */
34 int emufs_b_plus_crear(INDICE *idx) {
40 /* Creamos el archivo que contendra el indice */
41 fp = fopen(idx->filename, "w");
42 PERR("Creando indice con nodo raiz");
44 PERR("Error al crear el archivo");
49 /* Creamos el nodo raiz y lo guardamos el en indice */
50 raiz = b_plus_crearnodo(idx);
51 error = b_plus_grabar_nodo(idx,raiz,0);
53 /* Liberamos areas de memoria reservadas */
62 /** Busca el nro de bloque donde se debe guardar un reg con clave X.
63 * Posibilidades: return 0 - Encontro un bloque potencial
64 * return -1 - No hay clave, inserto clave de nuevo bloques
65 * return 1 - Hubo falla de lectura de un nodo, Abortar
67 int emufs_b_plus_get_bloque(INDICE *idx, INDEX_DAT *query, int num_node) {
71 nodo = b_plus_leer_nodo(idx,num_node);
72 if (nodo == NULL) return 1;
73 i = nodo->cant_claves - 1;
75 /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
76 if (nodo->nivel == 0) {
77 /* Vemos en que bloque deberia ir */
78 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
80 /* La clave es menor que todas, debo insertarla */
81 b_plus_destruir_nodo(nodo);
82 /*emufs_b_plus_insertar(idx,query);*/
86 /* Encontre un bloque potencial */
87 query->num_bloque = nodo->hijos[i];
88 b_plus_destruir_nodo(nodo);
93 /* Buscamos por donde descender al siguiente nivel */
94 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
96 num_node = nodo->hijos[i];
97 b_plus_destruir_nodo(nodo);
98 exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
103 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node) {
107 NODO_B_PLUS *memnode = b_plus_crearnodo(idx);
108 char *disknode = (char*)malloc(idx->tam_bloque);
111 PERR("Se intento leer nodo negativo!!\n");
114 if (disknode == NULL) return NULL;
115 if (memnode == NULL) return NULL;
118 fp = fopen(idx->filename, "r+");
121 b_plus_destruir_nodo(memnode);
125 /* Intentamos leer un nodo, sino podemos error! */
126 fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
127 if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
134 /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
135 memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
136 memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
137 memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
140 /*printf("Dumping Node_%i\n",num_node);
141 printf("Nivel: %i Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
143 for (i = 0; i < idx->size_claves/sizeof(CLAVE); ++i) printf(" %i",memnode->claves[i].i_clave);
145 for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
146 printf("\nEnd Dump\n"); */
152 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node)
156 fp = fopen(idx->filename, "r+");
157 if (fp == NULL) return -1;
159 fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);
160 fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
161 fwrite(nodo->claves,idx->size_claves,1,fp);
162 fwrite(nodo->hijos,idx->size_hijos,1,fp);
168 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
176 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
179 int minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
180 int numbrother,j = 0;
183 NODO_B_PLUS *brother = b_plus_crearnodo(idx);
184 brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
186 /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
187 /* pues el ancla se debe repetir ademas de subir */
188 if (brother->nivel == 0) {
189 brother->cant_claves = minclaves+1;
192 else brother->cant_claves = minclaves;
194 /* Copio las claves al brother derecho */
195 for (j = 0; j < brother->cant_claves; ++j)
196 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
198 /* Copio los hijos ya sea para hoja o no hoja. */
199 for (j = 0; j < brother->cant_claves+1; ++j)
200 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
202 /* Ahora me ocupo del nodo que se partio */
203 fullnode->cant_claves = minclaves;
204 /* Obtengo numero de nodo para brother y encadeno si es hoja */
205 numbrother = b_plus_get_num_nodo(idx);
206 if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
208 /* Ahora fixeamos el padre, apuntando al nuevo hijo */
209 for (j = parent->cant_claves; j > ithchild; --j)
210 parent->hijos[j+1] = parent->hijos[j];
211 parent->hijos[ithchild+1] = numbrother;
213 /* Idem pero subo la median key */
214 for (j = parent->cant_claves-1; j >= ithchild; --j)
215 parent->claves[j+1] = parent->claves[j];
216 parent->claves[ithchild] = fullnode->claves[minclaves];
217 parent->cant_claves++;
219 /* Grabo los nodos en disco */
220 b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
221 b_plus_grabar_nodo(idx,brother,numbrother);
222 b_plus_grabar_nodo(idx,parent,numparent);
224 b_plus_destruir_nodo(brother);
230 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
232 int i, num_nodo_hijo;
235 i = nodo->cant_claves-1;
236 if ( nodo->nivel == 0 ){
237 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ){
238 nodo->claves[i+1] = nodo->claves[i];
239 nodo->hijos[i+2] = nodo->hijos[i+1];
240 nodo->hijos[i+1] = nodo->hijos[i];
243 nodo->claves[i+1] = query->clave;
244 nodo->hijos[i+1] = query->num_bloque;
246 b_plus_grabar_nodo(idx, nodo, num_nodo);
248 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave )
251 num_nodo_hijo = nodo->hijos[i];
252 hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
253 if ( hijo->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
254 b_plus_split_child(idx, num_nodo, nodo, i, hijo);
255 if ( query->clave.i_clave > nodo->claves[i].i_clave )
258 if (hijo) b_plus_destruir_nodo(hijo);
259 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
260 b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
261 if (hijo) b_plus_destruir_nodo(hijo);
267 int emufs_b_plus_insertar(INDICE *idx, INDEX_DAT *query)
271 raiz = b_plus_leer_nodo(idx, 0);
272 if ( raiz->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
273 NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
274 new_root->nivel = raiz->nivel + 1;
275 new_root->hijos[0] = b_plus_get_num_nodo(idx);
276 b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
277 b_plus_grabar_nodo(idx, new_root, 0);
278 b_plus_split_child(idx, 0, new_root, 0, raiz);
279 b_plus_insert_nonfull(idx, new_root, 0, query);
280 b_plus_destruir_nodo(new_root);
283 b_plus_insert_nonfull(idx, raiz, 0, query);
286 b_plus_destruir_nodo(raiz);
291 /** Busca una clave dentro del arbol e indica si existe o no
292 * Posibilidades: return 1 - Encontro la clave
293 * return 0 - No encontro la clave
294 * return -1 - Hubo falla de lectura de un nodo, Abortar
296 int b_plus_existe_clave(INDICE *idx, INDEX_DAT *query, int num_node)
300 nodo = b_plus_leer_nodo(idx,num_node);
301 if (nodo == NULL) return -1;
302 i = nodo->cant_claves - 1;
304 /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
305 if (nodo->nivel == 0) {
306 /* Vemos si esta la clave */
307 while ( i >= 0 && query->clave.i_clave != nodo->claves[i].i_clave ) i--;
310 b_plus_destruir_nodo(nodo);
311 return 0; /* No encontre la clave */
313 /* Encontre la clave, guardo el nodo donde esta! */
314 query->num_bloque = num_node;
315 b_plus_destruir_nodo(nodo);
320 /* Buscamos por donde descender al siguiente nivel */
321 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
323 num_node = nodo->hijos[i];
324 b_plus_destruir_nodo(nodo);
325 exitcode = b_plus_existe_clave(idx,query,num_node);
330 int b_plus_cant_claves_nodo(INDICE *idx, int num_node)
332 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
333 if (nodo == NULL) return -1;
334 return nodo->cant_claves;
337 /* Search_Type: 0 - Predecesor, 1 - Sucesor
338 Exitcode: 1 - Encontre lo buscado, 0 - No lo encontre, -1 Error */
339 int b_plus_buscar_prepost(INDICE *idx, CLAVE key, int num_node, INDEX_DAT *prepostkey, int search_type)
341 int i = 0, exitcode = 0;
342 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
343 if (nodo == NULL) return -1;
344 i = nodo->cant_claves - 1;
346 if (nodo->nivel == 0) {
347 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;
348 switch (search_type) {
349 /* Busco predecesor en la hoja */
350 case 0: if (i <= 0) exitcode = 0;
352 if (nodo->claves[i].i_clave == key.i_clave) {
353 prepostkey->clave = nodo->claves[i-1];
354 prepostkey->num_bloque = nodo->hijos[i-1];
356 prepostkey->clave = nodo->claves[i];
357 prepostkey->num_bloque = nodo->hijos[i];
362 /* Busco sucesor en la hoja */
363 case 1: if ((nodo->claves[i].i_clave == key.i_clave) && (i == nodo->cant_claves-1)) exitcode = 0;
365 prepostkey->clave = nodo->claves[i+1];
366 prepostkey->num_bloque = nodo->hijos[i+i];
372 /* Veo por que rama debo seguir buscando el pre o post */
373 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;
374 if (search_type == 0) {
375 if (i < 0) exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
377 /* Busco primero por la rama derecha, sino por la izquierda */
378 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
380 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i],prepostkey,search_type);
382 /* Handleo busqueda de clave menor o igual que todas */
383 if (exitcode == 0) exitcode = -1;
385 /* Busco un sucesor, y funciona como getbloque... */
386 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
387 /* Veo si tengo que devolver la clave izquierda del padre del que acabo de buscar */
389 if (i < nodo->cant_claves-1) {
390 prepostkey->clave = nodo->claves[i+1];
392 } else exitcode = -1;
397 /* Libero y devuelvo exitcode */
398 b_plus_destruir_nodo(nodo);
402 int b_plus_reemplazar_clave(INDICE *idx, CLAVE key, INDEX_DAT query)
407 auxquery.clave = key;
409 /* Comienzo buscando la clave y obteniendo el nodo en donde esta */
410 if (b_plus_existe_clave(idx,&auxquery,0) == 1) {
412 /* Levanto el nodo y busco donde esta la clave */
413 printf("El reemplazar encontro la clave %i y en el nodo %i\n",auxquery.clave.i_clave,(int)auxquery.num_bloque);
414 nodo = b_plus_leer_nodo(idx,auxquery.num_bloque);
415 if (nodo == NULL) return -1;
416 i = nodo->cant_claves - 1;
418 /* Busco la clave y reemplazo */
419 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
420 if (i < 0) return -1; /* Error, no esta la clave */
422 /* Cheque por las dudas si es hoja o interno, aunque deberia ser hoja */
423 if (nodo->nivel > 0) {
424 nodo->claves[i] = query.clave;
426 nodo->claves[i] = query.clave;
427 nodo->hijos[i] = query.num_bloque;
429 b_plus_grabar_nodo(idx,nodo,auxquery.num_bloque);
430 b_plus_destruir_nodo(nodo);
436 int emufs_b_plus_eliminar(INDICE *idx, CLAVE key, int num_node)
438 INDEX_DAT prepostkey;
439 int i = 0,j = 0,minclaves = 0, cant_claves_child = 0;
440 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
441 NODO_B_PLUS *hijoder,*hijoizq;
442 if (nodo == NULL) return -1;
443 i = nodo->cant_claves - 1;
444 minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
446 /* Si es hoja, borro directamente la clave. No se producira underflow
447 pues lo asegura la recursividad del delete */
448 if (nodo->nivel == 0) {
449 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
450 if (i < 0) return -1;
451 /* Encontre la clave en la pos i, la borro */
452 for (j = i; j < nodo->cant_claves-1; ++j) {
453 nodo->claves[j] = nodo->claves[j+1];
454 nodo->hijos[j] = nodo->hijos[j+1];
456 nodo->hijos[j] = nodo->hijos[j+1];
459 /* Grabo el nodo actualizado en disco */
460 b_plus_grabar_nodo(idx,nodo,num_node);
461 b_plus_destruir_nodo(nodo);
464 /* Me debo fijar si esta la clave en este nodo interno, sino busco */
465 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
467 /* No esta en este nodo interno, caso 3 */
469 /* Esta en el nodo interno, caso 2 */
470 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i]);
471 if (cant_claves_child > minclaves) {
472 /* Caso 2a, comienzo buscando la clave previa inmediata */
473 b_plus_buscar_prepost(idx,key,nodo->hijos[i],&prepostkey,0);
474 /* La elimino recursivamente */
475 emufs_b_plus_eliminar(idx,prepostkey.clave,0);
476 /* Remplazo mi clave key por la encontrada prekey */
477 nodo->claves[i] = prepostkey.clave;
478 /* Remplazo la otra instancia de key en una hoja seguro por prekey */
479 emufs_b_plus_reemplazar_clave(idx,key,prepostkey.clave);
481 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i+1]);
482 if (cant_claves_child > minclaves) {
483 /* Caso 2b, comienzo buscando la clave previa inmediata */
484 b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],&prepostkey,1);
485 /* La elimino recursivamente */
486 emufs_b_plus_eliminar(idx,prepostkey.clave,0);
487 /* Remplazo mi clave key por la encontrada postkey */
488 nodo->claves[i] = prepostkey.clave;
489 /* Remplazo la otra instancia de key en una hoja seguro por postkey */
490 emufs_b_plus_reemplazar_clave(idx,key,prepostkey.clave);
492 /* Caso 2c debo hacer un merge de la clave con hijo izq y der */
493 node_y = b_plus_leer_nodo(idx,nodo->hijos[i]);
494 node_z = b_plus_leer_nodo(idx,nodo->hijos[i+1]);
495 /* Bajo la clave Key a NodoY y muevo todo lo de NodoZ a NodoY */
496 node_y->claves[minclaves] = nodo->claves[i];
497 for (j = 0; j < minclaves; ++j) node_y->claves[j+minclaves+1] = node_z->claves[j];
498 for (j = 0; j < minclaves+1; ++j) node_y->hijos[j+minclaves+1] = node_z->hijos[j];
499 b_plus_destruir_nodo(z);
500 /* Shifteo en el nodo padre NODO, para quitar la que bajo */
501 for (j = i; j < nodo->cant_claves-1; ++j) {
502 nodo->claves[j] = nodo->claves[j+1];
503 nodo->hijos[j+1] = nodo->hijos[j+2];
514 int b_plus_get_num_nodo(INDICE *idx)
519 fp = fopen(idx->filename, "ab");
520 if (fp == NULL) return -1;
522 num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
523 printf("Num Nodo Nuevo: %i\n",num);