3 #include "indice_bplus.h"
5 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
6 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node);
7 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node);
8 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
11 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
12 int b_plus_insertar(INDICE *idx, INDEX_DAT *query);
13 int b_plus_get_num_nodo(INDICE *idx);
14 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
16 /** Crea un nuevo nodo y lo inicializa */
17 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx) {
19 NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
20 if (nodo == NULL) return NULL;
22 nodo->cant_claves = 0;
24 /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
25 nodo->claves = (CLAVE*)malloc(idx->size_claves);
26 nodo->hijos = (int*)malloc(idx->size_hijos);
27 memset(nodo->claves,-1,idx->size_claves);
28 memset(nodo->hijos,-1,idx->size_hijos);
33 /** Crea el archivo indice B+ */
34 int emufs_b_plus_crear(INDICE *idx) {
40 /* Creamos el archivo que contendra el indice */
41 fp = fopen(idx->filename, "w");
42 PERR("Creando indice con nodo raiz");
44 PERR("Error al crear el archivo");
49 /* Creamos el nodo raiz y lo guardamos el en indice */
50 raiz = b_plus_crearnodo(idx);
51 error = b_plus_grabar_nodo(idx,raiz,0);
53 /* Liberamos areas de memoria reservadas */
62 /** Busca el nro de bloque donde se debe guardar un reg con clave X.
63 * Posibilidades: return 0 - Encontro un bloque potencial
64 * return -1 - No hay clave, inserto clave de nuevo bloques
65 * return 1 - Hubo falla de lectura de un nodo, Abortar
67 int emufs_b_plus_get_bloque(INDICE *idx, INDEX_DAT *query, int num_node) {
71 nodo = b_plus_leer_nodo(idx,num_node);
72 if (nodo == NULL) return 1;
73 i = nodo->cant_claves - 1;
75 /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
76 if (nodo->nivel == 0) {
77 /* Vemos en que bloque deberia ir */
78 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
80 /* La clave es menor que todas, debo insertarla */
81 b_plus_destruir_nodo(nodo);
82 /*emufs_b_plus_insertar(idx,query); */
86 /* Encontre un bloque potencial */
87 query->num_bloque = nodo->hijos[i];
88 b_plus_destruir_nodo(nodo);
93 /* Buscamos por donde descender al siguiente nivel */
94 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
96 num_node = nodo->hijos[i];
97 b_plus_destruir_nodo(nodo);
98 exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
103 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node) {
107 NODO_B_PLUS *memnode = b_plus_crearnodo(idx);
108 char *disknode = (char*)malloc(idx->tam_bloque);
111 PERR("Se intento leer nodo negativo!!\n");
114 if (disknode == NULL) return NULL;
115 if (memnode == NULL) return NULL;
118 fp = fopen(idx->filename, "r+");
121 b_plus_destruir_nodo(memnode);
125 /* Intentamos leer un nodo, sino podemos error! */
126 fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
127 if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
134 /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
135 memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
136 memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
137 memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
140 /*printf("Dumping Node_%i\n",num_node);
141 printf("Nivel: %i Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
143 for (i = 0; i < idx->size_claves/sizeof(CLAVE); ++i) printf(" %i",memnode->claves[i].i_clave);
145 for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
146 printf("\nEnd Dump\n"); */
152 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node)
156 fp = fopen(idx->filename, "r+");
157 if (fp == NULL) return -1;
159 fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);
160 fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
161 fwrite(nodo->claves,idx->size_claves,1,fp);
162 fwrite(nodo->hijos,idx->size_hijos,1,fp);
168 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
176 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
179 int minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
180 int numbrother,j = 0;
183 NODO_B_PLUS *brother = b_plus_crearnodo(idx);
184 brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
186 /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
187 /* pues el ancla se debe repetir ademas de subir */
188 if (brother->nivel == 0) {
189 brother->cant_claves = minclaves+1;
192 else brother->cant_claves = minclaves;
194 /* Copio las claves al brother derecho */
195 for (j = 0; j < brother->cant_claves; ++j)
196 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
198 /* Copio los hijos ya sea para hoja o no hoja. */
199 for (j = 0; j < brother->cant_claves+1; ++j)
200 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
202 /* Ahora me ocupo del nodo que se partio */
203 fullnode->cant_claves = minclaves;
204 /* Obtengo numero de nodo para brother y encadeno si es hoja */
205 numbrother = b_plus_get_num_nodo(idx);
206 if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
208 /* Ahora fixeamos el padre, apuntando al nuevo hijo */
209 for (j = parent->cant_claves; j > ithchild; --j)
210 parent->hijos[j+1] = parent->hijos[j];
211 parent->hijos[ithchild+1] = numbrother;
213 /* Idem pero subo la median key */
214 for (j = parent->cant_claves-1; j >= ithchild; --j)
215 parent->claves[j+1] = parent->claves[j];
216 parent->claves[ithchild] = fullnode->claves[minclaves];
217 parent->cant_claves++;
219 /* Grabo los nodos en disco */
220 b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
221 b_plus_grabar_nodo(idx,brother,numbrother);
222 b_plus_grabar_nodo(idx,parent,numparent);
224 b_plus_destruir_nodo(brother);
230 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
232 int i, num_nodo_hijo;
235 i = nodo->cant_claves-1;
236 if ( nodo->nivel == 0 ){
237 /* Muevo siempre el encadenamiento */
238 nodo->hijos[i+2] = nodo->hijos[i+1];
239 /* Ahora muevo las claves y sus punteros a bloques del dat */
240 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ){
241 nodo->claves[i+1] = nodo->claves[i];
242 nodo->hijos[i+1] = nodo->hijos[i];
245 nodo->claves[i+1] = query->clave;
246 nodo->hijos[i+1] = query->num_bloque;
248 b_plus_grabar_nodo(idx, nodo, num_nodo);
250 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave )
253 num_nodo_hijo = nodo->hijos[i];
254 hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
255 if ( hijo->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
256 b_plus_split_child(idx, num_nodo, nodo, i, hijo);
257 if ( query->clave.i_clave > nodo->claves[i].i_clave )
260 if (hijo) b_plus_destruir_nodo(hijo);
261 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
262 b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
263 if (hijo) b_plus_destruir_nodo(hijo);
269 int emufs_b_plus_insertar(INDICE *idx, INDEX_DAT *query)
273 raiz = b_plus_leer_nodo(idx, 0);
274 if ( raiz->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
275 NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
276 new_root->nivel = raiz->nivel + 1;
277 new_root->hijos[0] = b_plus_get_num_nodo(idx);
278 b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
279 b_plus_grabar_nodo(idx, new_root, 0);
280 b_plus_split_child(idx, 0, new_root, 0, raiz);
281 b_plus_insert_nonfull(idx, new_root, 0, query);
282 b_plus_destruir_nodo(new_root);
285 b_plus_insert_nonfull(idx, raiz, 0, query);
288 b_plus_destruir_nodo(raiz);
293 /** Busca una clave dentro del arbol e indica si existe o no
294 * Posibilidades: return 1 - Encontro la clave
295 * return 0 - No encontro la clave
296 * return -1 - Hubo falla de lectura de un nodo, Abortar
298 int b_plus_existe_clave(INDICE *idx, INDEX_DAT *query, int num_node)
302 nodo = b_plus_leer_nodo(idx,num_node);
303 if (nodo == NULL) return -1;
304 i = nodo->cant_claves - 1;
306 /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
307 if (nodo->nivel == 0) {
308 /* Vemos si esta la clave */
309 while ( i >= 0 && query->clave.i_clave != nodo->claves[i].i_clave ) i--;
312 b_plus_destruir_nodo(nodo);
313 return 0; /* No encontre la clave */
315 /* Encontre la clave, guardo el nodo donde esta! */
316 query->num_bloque = num_node;
317 b_plus_destruir_nodo(nodo);
322 /* Buscamos por donde descender al siguiente nivel */
323 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
325 num_node = nodo->hijos[i];
326 b_plus_destruir_nodo(nodo);
327 exitcode = b_plus_existe_clave(idx,query,num_node);
332 int b_plus_cant_claves_nodo(INDICE *idx, int num_node)
334 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
335 if (nodo == NULL) return -1;
336 return nodo->cant_claves;
339 /* Search_Type: 0 - Predecesor, 1 - Sucesor
340 Exitcode: 1 - Encontre lo buscado, 0 - No lo encontre, -1 Error */
341 int b_plus_buscar_prepost(INDICE *idx, CLAVE key, int num_node, INDEX_DAT *prepostkey, int search_type)
343 int i = 0, exitcode = 0;
344 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
345 if (nodo == NULL) return -1;
346 i = nodo->cant_claves - 1;
348 if (nodo->nivel == 0) {
349 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;
350 switch (search_type) {
351 /* Busco predecesor en la hoja */
352 case 0: if (i <= 0) exitcode = 0;
354 if (nodo->claves[i].i_clave == key.i_clave) {
355 prepostkey->clave = nodo->claves[i-1];
356 prepostkey->num_bloque = nodo->hijos[i-1];
358 prepostkey->clave = nodo->claves[i];
359 prepostkey->num_bloque = nodo->hijos[i];
364 /* Busco sucesor en la hoja */
365 case 1: if ((nodo->claves[i].i_clave == key.i_clave) && (i == nodo->cant_claves-1)) exitcode = 0;
367 prepostkey->clave = nodo->claves[i+1];
368 prepostkey->num_bloque = nodo->hijos[i+1];
374 /* Veo por que rama debo seguir buscando el pre o post */
375 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;
376 if (search_type == 0) {
377 if (i < 0) exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
379 /* Busco primero por la rama derecha, sino por la izquierda */
380 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
382 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i],prepostkey,search_type);
384 /* Handleo busqueda de clave menor o igual que todas */
385 if (exitcode == 0) exitcode = -1;
387 /* Busco un sucesor, y funciona como getbloque... */
388 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
389 /* Veo si tengo que devolver la clave izquierda del padre del que acabo de buscar */
391 if (i < nodo->cant_claves-1) {
392 prepostkey->clave = nodo->claves[i+1];
394 } else exitcode = -1;
399 /* Libero y devuelvo exitcode */
400 b_plus_destruir_nodo(nodo);
404 int emufs_b_plus_reemplazar_clave(INDICE *idx, CLAVE key, INDEX_DAT query, int num_node)
409 auxquery.clave = key;
411 /* Comienzo buscando la clave y obteniendo el nodo en donde esta */
412 if (b_plus_existe_clave(idx,&auxquery,num_node) == 1) {
414 /* Levanto el nodo y busco donde esta la clave */
415 /*printf("El reemplazar encontro la clave %i y en el nodo %i\n",auxquery.clave.i_clave,(int)auxquery.num_bloque);*/
416 nodo = b_plus_leer_nodo(idx,auxquery.num_bloque);
417 if (nodo == NULL) return -1;
418 i = nodo->cant_claves - 1;
420 /* Busco la clave y reemplazo */
421 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
422 if (i < 0) return -1; /* Error, no esta la clave */
424 /* Cheque por las dudas si es hoja o interno, aunque deberia ser hoja */
425 if (nodo->nivel > 0) {
426 nodo->claves[i] = query.clave;
428 nodo->claves[i] = query.clave;
429 nodo->hijos[i] = query.num_bloque;
431 b_plus_grabar_nodo(idx,nodo,auxquery.num_bloque);
432 b_plus_destruir_nodo(nodo);
438 int emufs_b_plus_eliminar(INDICE *idx, CLAVE key, int num_node)
440 INDEX_DAT prepostkey;
441 int i = 0,j = 0,minclaves = 0, nivel_mayor1 = 0,cant_claves_child = 0;
442 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
443 NODO_B_PLUS *node_y,*node_z;
444 if (nodo == NULL) { PERR("No leyo nodo bien"); return -1; }
445 i = nodo->cant_claves - 1;
446 minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
448 /* Si es hoja, borro directamente la clave. No se producira underflow
449 pues lo asegura la recursividad del delete */
450 if (nodo->nivel == 0) {
451 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
452 if (i < 0) return -1;
453 /* Encontre la clave en la pos i, la borro */
454 for (j = i; j < nodo->cant_claves-1; ++j) {
455 nodo->claves[j] = nodo->claves[j+1];
456 nodo->hijos[j] = nodo->hijos[j+1];
458 nodo->hijos[j] = nodo->hijos[j+1];
461 /* Grabo el nodo actualizado en disco */
462 b_plus_grabar_nodo(idx,nodo,num_node);
463 b_plus_destruir_nodo(nodo);
466 /* Me debo fijar si esta la clave en este nodo interno, sino busco */
467 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
469 /* No esta en este nodo interno, caso 3 */
471 /* Esta en el nodo interno, caso 2 */
472 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i]);
473 if (cant_claves_child > minclaves) {
474 PERR("Entre caso 2a del eliminar");
475 /* Caso 2a, comienzo buscando la clave previa inmediata */
476 b_plus_buscar_prepost(idx,key,nodo->hijos[i],&prepostkey,0);
477 /* La elimino recursivamente */
478 emufs_b_plus_eliminar(idx,prepostkey.clave,nodo->hijos[i]); /* CHEAT */
479 /* Remplazo mi clave key por la encontrada prekey */
480 nodo->claves[i] = prepostkey.clave;
481 b_plus_grabar_nodo(idx,nodo,num_node);
482 /* Remplazo la otra instancia de key en una hoja seguro por prekey */
483 emufs_b_plus_reemplazar_clave(idx,key,prepostkey,nodo->hijos[i+1]);
485 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i+1]);
486 if (cant_claves_child > minclaves) {
487 PERR("Entre caso 2b del eliminar");
488 /* Caso 2b, comienzo buscando la clave sucesor inmediata */
489 b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],&prepostkey,1);
490 /* La elimino recursivamente */
491 emufs_b_plus_eliminar(idx,prepostkey.clave,nodo->hijos[i+1]); /* CHEAT */
492 /* Remplazo mi clave key por la encontrada postkey */
493 nodo->claves[i] = prepostkey.clave;
494 b_plus_grabar_nodo(idx,nodo,num_node);
495 /* Remplazo la otra instancia de key en una hoja seguro por postkey */
496 emufs_b_plus_reemplazar_clave(idx,key,prepostkey,nodo->hijos[i+1]);
498 PERR("Entre caso 2c del eliminar");
499 /* Caso 2c debo hacer un merge de la clave con hijo izq y der */
500 node_y = b_plus_leer_nodo(idx,nodo->hijos[i]);
501 node_z = b_plus_leer_nodo(idx,nodo->hijos[i+1]);
502 /* Bajo la clave Key a NodoY y muevo todo lo de NodoZ a NodoY */
503 /* Si es nivel mayor a 1, bajo clave pues no esta en NodoZ, otherwise no bajo */
504 if (nodo->nivel > 1) {
506 node_y->claves[minclaves] = key;
508 for (j = 0; j < minclaves; ++j) node_y->claves[j+minclaves+nivel_mayor1] = node_z->claves[j];
509 for (j = 0; j < minclaves+1; ++j) node_y->hijos[j+minclaves+nivel_mayor1] = node_z->hijos[j];
510 node_y->cant_claves = minclaves*2+nivel_mayor1;
511 /* Shifteo en el nodo padre NODO, para quitar la que bajo */
512 for (j = i; j < nodo->cant_claves-1; ++j) {
513 nodo->claves[j] = nodo->claves[j+1];
514 nodo->hijos[j+1] = nodo->hijos[j+2];
517 b_plus_grabar_nodo(idx,nodo,num_node);
518 b_plus_grabar_nodo(idx,node_y,nodo->hijos[i]);
519 b_plus_destruir_nodo(node_y);
520 b_plus_destruir_nodo(node_z);
521 /* Elimino recursivamente Key de NodeY, entrando por ese subtree */
522 emufs_b_plus_eliminar(idx,key,nodo->hijos[i]);
523 /* Caso muy particular, si hize un merge de la unica clave de una raiz con sus hijos */
524 if ((nodo->nivel == 1) && (nodo->cant_claves == 0)) {
525 /* Debo establecer como nueva raiz, el NodoY */
526 node_y = b_plus_leer_nodo(idx,nodo->hijos[i]);
527 b_plus_grabar_nodo(idx,node_y,0);
528 truncate(idx->filename,SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
533 /* Termine caso 2 o 3, libero el nodo */
534 b_plus_destruir_nodo(nodo);
541 int b_plus_get_num_nodo(INDICE *idx)
546 fp = fopen(idx->filename, "ab");
547 if (fp == NULL) return -1;
549 num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);