3 #include "indice_bplus.h"
5 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
6 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node);
7 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node);
8 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
11 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
12 int b_plus_insertar(INDICE *idx, INDEX_DAT *query);
13 int b_plus_get_num_nodo(INDICE *idx);
14 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
16 /** Crea un nuevo nodo y lo inicializa */
17 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx) {
19 NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
20 if (nodo == NULL) return NULL;
22 nodo->cant_claves = 0;
24 /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
25 nodo->claves = (CLAVE*)malloc(idx->size_claves);
26 nodo->hijos = (int*)malloc(idx->size_hijos);
27 memset(nodo->claves,-1,idx->size_claves);
28 memset(nodo->hijos,-1,idx->size_hijos);
33 /** Crea el archivo indice B+ */
34 int emufs_b_plus_crear(INDICE *idx) {
40 /* Creamos el archivo que contendra el indice */
41 fp = fopen(idx->filename, "w");
42 PERR("Creando indice con nodo raiz");
44 PERR("Error al crear el archivo");
49 /* Creamos el nodo raiz y lo guardamos el en indice */
50 raiz = b_plus_crearnodo(idx);
51 error = b_plus_grabar_nodo(idx,raiz,0);
53 /* Liberamos areas de memoria reservadas */
62 /** Busca el nro de bloque donde se debe guardar un reg con clave X.
63 * Posibilidades: return 0 - Encontro un bloque potencial
64 * return -1 - No hay clave, inserto clave de nuevo bloques
65 * return 1 - Hubo falla de lectura de un nodo, Abortar
67 int emufs_b_plus_get_bloque(INDICE *idx, INDEX_DAT *query, int num_node) {
71 nodo = b_plus_leer_nodo(idx,num_node);
72 if (nodo == NULL) return 1;
73 i = nodo->cant_claves - 1;
75 /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
76 if (nodo->nivel == 0) {
77 /* Vemos en que bloque deberia ir */
78 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
80 /* La clave es menor que todas, debo insertarla */
81 b_plus_destruir_nodo(nodo);
82 emufs_b_plus_insertar(idx,query);
86 /* Encontre un bloque potencial */
87 query->num_bloque = nodo->hijos[i];
88 b_plus_destruir_nodo(nodo);
93 /* Buscamos por donde descender al siguiente nivel */
94 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
96 num_node = nodo->hijos[i];
97 b_plus_destruir_nodo(nodo);
98 exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
103 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node) {
107 NODO_B_PLUS *memnode = b_plus_crearnodo(idx);
108 char *disknode = (char*)malloc(idx->tam_bloque);
111 PERR("Se intento leer nodo negativo!!\n");
114 if (disknode == NULL) return NULL;
115 if (memnode == NULL) return NULL;
118 fp = fopen(idx->filename, "r+");
121 b_plus_destruir_nodo(memnode);
125 /* Intentamos leer un nodo, sino podemos error! */
126 fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
127 if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
134 /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
135 memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
136 memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
137 memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
140 /*printf("Dumping Node_%i\n",num_node);
141 printf("Nivel: %i Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
143 for (i = 0; i < idx->size_claves/sizeof(CLAVE); ++i) printf(" %i",memnode->claves[i].i_clave);
145 for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
146 printf("\nEnd Dump\n"); */
152 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node)
156 fp = fopen(idx->filename, "r+");
157 if (fp == NULL) return -1;
159 fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);
160 fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
161 fwrite(nodo->claves,idx->size_claves,1,fp);
162 fwrite(nodo->hijos,idx->size_hijos,1,fp);
168 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
176 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
179 int minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
180 int numbrother,j = 0;
183 NODO_B_PLUS *brother = b_plus_crearnodo(idx);
184 brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
186 /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
187 /* pues el ancla se debe repetir ademas de subir */
188 if (brother->nivel == 0) {
189 brother->cant_claves = minclaves+1;
192 else brother->cant_claves = minclaves;
194 /* Copio las claves al brother derecho */
195 for (j = 0; j < brother->cant_claves; ++j)
196 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
198 /* Copio los hijos ya sea para hoja o no hoja. */
199 for (j = 0; j < brother->cant_claves+1; ++j)
200 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
202 /* Ahora me ocupo del nodo que se partio */
203 fullnode->cant_claves = minclaves;
204 /* Obtengo numero de nodo para brother y encadeno si es hoja */
205 numbrother = b_plus_get_num_nodo(idx);
206 if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
208 /* Ahora fixeamos el padre, apuntando al nuevo hijo */
209 for (j = parent->cant_claves; j > ithchild; --j)
210 parent->hijos[j+1] = parent->hijos[j];
211 parent->hijos[ithchild+1] = numbrother;
213 /* Idem pero subo la median key */
214 for (j = parent->cant_claves-1; j >= ithchild; --j)
215 parent->claves[j+1] = parent->claves[j];
216 parent->claves[ithchild] = fullnode->claves[minclaves];
217 parent->cant_claves++;
219 /* Grabo los nodos en disco */
220 b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
221 b_plus_grabar_nodo(idx,brother,numbrother);
222 b_plus_grabar_nodo(idx,parent,numparent);
224 b_plus_destruir_nodo(brother);
230 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
232 int i, num_nodo_hijo;
235 i = nodo->cant_claves-1;
236 if ( nodo->nivel == 0 ){
237 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ){
238 nodo->claves[i+1] = nodo->claves[i];
239 nodo->hijos[i+2] = nodo->hijos[i+1];
240 nodo->hijos[i+1] = nodo->hijos[i];
243 nodo->claves[i+1] = query->clave;
244 nodo->hijos[i+1] = query->num_bloque;
246 b_plus_grabar_nodo(idx, nodo, num_nodo);
248 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave )
251 num_nodo_hijo = nodo->hijos[i];
252 hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
253 if ( hijo->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
254 b_plus_split_child(idx, num_nodo, nodo, i, hijo);
255 if ( query->clave.i_clave > nodo->claves[i].i_clave )
258 if (hijo) b_plus_destruir_nodo(hijo);
259 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
260 b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
261 if (hijo) b_plus_destruir_nodo(hijo);
267 int emufs_b_plus_insertar(INDICE *idx, INDEX_DAT *query)
271 raiz = b_plus_leer_nodo(idx, 0);
272 if ( raiz->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
273 NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
274 new_root->nivel = raiz->nivel + 1;
275 new_root->hijos[0] = b_plus_get_num_nodo(idx);
276 b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
277 b_plus_grabar_nodo(idx, new_root, 0);
278 b_plus_split_child(idx, 0, new_root, 0, raiz);
279 b_plus_insert_nonfull(idx, new_root, 0, query);
280 b_plus_destruir_nodo(new_root);
283 b_plus_insert_nonfull(idx, raiz, 0, query);
286 b_plus_destruir_nodo(raiz);
291 /** Busca una clave dentro del arbol e indica si existe o no
292 * Posibilidades: return 1 - Encontro la clave
293 * return 0 - No encontro la clave
294 * return -1 - Hubo falla de lectura de un nodo, Abortar
296 int b_plus_existe_clave(INDICE *idx, INDEX_DAT *query, int num_node)
300 nodo = b_plus_leer_nodo(idx,num_node);
301 if (nodo == NULL) return -1;
302 i = nodo->cant_claves - 1;
304 /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
305 if (nodo->nivel == 0) {
306 /* Vemos en que bloque deberia ir */
307 while ( i >= 0 && query->clave.i_clave != nodo->claves[i].i_clave ) i--;
308 b_plus_destruir_nodo(nodo);
309 if (i < 0) return 0; /* No encontre la clave */
310 else return 1; /* Encontre la clave */
313 /* Buscamos por donde descender al siguiente nivel */
314 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
316 num_node = nodo->hijos[i];
317 b_plus_destruir_nodo(nodo);
318 exitcode = b_plus_existe_clave(idx,query,num_node);
323 int b_plus_cant_claves_nodo(INDICE *idx, int num_node)
325 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
326 if (nodo == NULL) return -1;
327 return nodo->cant_claves;
330 /* Search_Type: 0 - Predecesor, 1 - Sucesor
331 Exitcode: 1 - Encontre lo buscado, 0 - No lo encontre, -1 Error */
332 int b_plus_buscar_prepost(INDICE *idx, CLAVE key, int num_node, CLAVE *prepostkey, int search_type)
334 int i = 0, exitcode = 0;
335 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
336 if (nodo == NULL) return -1;
337 i = nodo->cant_claves - 1;
339 if (nodo->nivel == 0) {
340 printf ("Entre en hoja nro %i\n",num_node);
341 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;
342 switch (search_type) {
344 /* Busco predecesor en la hoja */
345 case 0: if (i <= 0) exitcode = 0;
347 if (nodo->claves[i].i_clave == key.i_clave) *prepostkey = nodo->claves[i-1];
348 else *prepostkey = nodo->claves[i];
353 /* Busco sucesor en la hoja */
354 case 1: if ((nodo->claves[i].i_clave == key.i_clave) && (i == nodo->cant_claves-1)) exitcode = 0;
356 *prepostkey = nodo->claves[i+1];
362 /* Veo por que rama debo seguir buscando el pre o post */
363 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;
364 if (search_type == 0) {
365 if (i < 0) exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
367 /* Busco primero por la rama derecha, sino por la izquierda */
368 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
370 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i],prepostkey,search_type);
372 /* Handleo busqueda de clave menor o igual que todas */
373 if (exitcode == 0) exitcode = -1;
375 /* Busco un sucesor, y funciona como getbloque... */
376 printf("Voy a buscar en hijo nro: %i\n",nodo->hijos[i+1]);
377 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
378 /* Veo si tengo que devolver la clave izquierda del padre del que acabo de buscar */
380 if (i < nodo->cant_claves-1) {
381 *prepostkey = nodo->claves[i+1];
383 } else exitcode = -1;
387 /* Libero y devuelvo exitcode */
388 b_plus_destruir_nodo(nodo);
392 int emufs_b_plus_eliminar(INDICE *idx, CLAVE key, int num_node)
394 int i = 0,j = 0,minclaves = 0, cant_claves_child = 0;
395 NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);
396 if (nodo == NULL) return -1;
397 i = nodo->cant_claves - 1;
398 minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
400 /* Si es hoja, borro directamente la clave. No se producira underflow
401 pues lo asegura la recursividad del delete */
402 if (nodo->nivel == 0) {
403 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
404 if (i < 0) return -1;
405 /* Encontre la clave en la pos i, la borro */
406 for (j = i; j < nodo->cant_claves-1; ++j) {
407 nodo->claves[j] = nodo->claves[j+1];
408 nodo->hijos[j] = nodo->hijos[j+1];
410 nodo->hijos[j] = nodo->hijos[j+1];
413 /* Grabo el nodo actualizado en disco */
414 b_plus_grabar_nodo(idx,nodo,num_node);
415 b_plus_destruir_nodo(nodo);
418 /* Me debo fijar si esta la clave en este nodo interno, sino busco */
419 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
421 /* No esta en este nodo interno, caso 3 */
423 /* Esta en el nodo interno, caso 2 */
424 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i]);
425 if (cant_claves_child > minclaves) {
429 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i+1]);
430 if (cant_claves_child > minclaves) {
446 int b_plus_get_num_nodo(INDICE *idx)
451 fp = fopen(idx->filename, "ab");
452 if (fp == NULL) return -1;
454 num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
455 printf("Num Nodo Nuevo: %i\n",num);