]> git.llucax.com Git - z.facultad/75.06/emufs.git/blob - emufs/indice_bplus.c
por ahora todas las pruebas que hice pasaron con exito... seguire buscando
[z.facultad/75.06/emufs.git] / emufs / indice_bplus.c
1 /** Arbol B+ */
2 #include "indices.h"
3 #include "indice_bplus.h"
4
5 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
6 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node);
7 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node);
8 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
11 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
12 int b_plus_insertar(INDICE *idx, INDEX_DAT *query);
13 int b_plus_get_num_nodo(INDICE *idx);
14 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
15
16 /** Crea un nuevo nodo y lo inicializa */
17 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx) {
18         
19         NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
20         if (nodo == NULL) return NULL;
21         nodo->nivel = 0;
22         nodo->cant_claves = 0;
23
24     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
25         nodo->claves = (CLAVE*)malloc(idx->size_claves);
26         nodo->hijos = (int*)malloc(idx->size_hijos);
27         memset(nodo->claves,-1,idx->size_claves);
28         memset(nodo->hijos,-1,idx->size_hijos);
29         
30     return nodo;
31 }
32
33 /** Crea el archivo indice B+ */
34 int emufs_b_plus_crear(INDICE *idx) {
35         
36         FILE *fp;
37         NODO_B_PLUS *raiz;
38         int error = 0;
39                 
40         /* Creamos el archivo que contendra el indice */
41         fp = fopen(idx->filename, "w");
42         PERR("Creando indice con nodo raiz");
43         if (fp == NULL) {
44                 PERR("Error al crear el archivo");
45                 return -1;
46         }
47         fclose(fp);
48         
49         /* Creamos el nodo raiz y lo guardamos el en indice */
50         raiz = b_plus_crearnodo(idx);
51         error = b_plus_grabar_nodo(idx,raiz,0);
52         
53         /* Liberamos areas de memoria reservadas */
54         free(raiz->claves);
55         free(raiz->hijos);
56         free(raiz);
57         
58         return error;
59 }
60
61
62 /** Busca el nro de bloque donde se debe guardar un reg con clave X.
63  *  Posibilidades: return 0 - Encontro un bloque potencial
64  *                 return -1 - No hay clave, inserto clave de nuevo bloques
65  *                 return 1 - Hubo falla de lectura de un nodo, Abortar
66  */
67 int emufs_b_plus_get_bloque(INDICE *idx, INDEX_DAT *query, int num_node) {
68
69         int i,exitcode = 0;
70         NODO_B_PLUS *nodo;
71         nodo = b_plus_leer_nodo(idx,num_node);
72         if (nodo == NULL) return 1;
73         i = nodo->cant_claves - 1;
74                 
75         /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
76         if (nodo->nivel == 0) {
77         /* Vemos en que bloque deberia ir */
78                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
79                 if (i < 0) {
80                         /* La clave es menor que todas, debo insertarla */
81                         b_plus_destruir_nodo(nodo);                     
82                         emufs_b_plus_insertar(idx,query);                       
83                         return -1;
84                 }
85                 else {
86                         /* Encontre un bloque potencial */
87                         query->num_bloque = nodo->hijos[i];
88                         b_plus_destruir_nodo(nodo);                     
89                         return 0;
90                 }
91         }
92         else {
93                 /* Buscamos por donde descender al siguiente nivel */
94                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
95         i++;
96         num_node = nodo->hijos[i];
97                 b_plus_destruir_nodo(nodo);
98                 exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
99                 return exitcode;                
100         }
101 }
102
103 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node) {
104
105         /*int i = 0;*/
106         FILE *fp;
107         NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
108         char *disknode = (char*)malloc(idx->tam_bloque);
109         
110         if (num_node < 0) {
111                 PERR("Se intento leer nodo negativo!!\n");
112                 exit(1);
113         }
114         if (disknode == NULL) return NULL;
115         if (memnode == NULL) return NULL;
116         
117     /* Open up file */
118         fp = fopen(idx->filename, "r+");
119         if (fp == NULL) {
120                 free(disknode);
121                 b_plus_destruir_nodo(memnode);
122                 return NULL;
123         }
124
125         /* Intentamos leer un nodo, sino podemos error! */
126         fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
127         if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
128                 free(disknode);
129                 fclose(fp);
130                 return NULL;
131         }
132         fclose(fp);
133         
134         /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
135         memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
136         memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
137         memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
138         free(disknode);
139         
140         /*printf("Dumping Node_%i\n",num_node);
141         printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
142         printf("Claves:");
143         for (i = 0; i < idx->size_claves/sizeof(CLAVE); ++i) printf(" %i",memnode->claves[i].i_clave);
144         printf("\nHijos:");
145         for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
146         printf("\nEnd Dump\n"); */
147         
148         return memnode;
149         
150 }
151
152 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node)
153 {
154         FILE *fp;
155         
156         fp = fopen(idx->filename, "r+");
157         if (fp == NULL) return -1;
158                 
159         fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);      
160         fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
161         fwrite(nodo->claves,idx->size_claves,1,fp);
162         fwrite(nodo->hijos,idx->size_hijos,1,fp);
163         fclose(fp);
164         
165         return 0;
166 }
167
168 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
169 {
170         free(nodo->claves);
171         free(nodo->hijos);
172         free(nodo);
173         return 0;
174 }
175
176 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
177 {
178         /* locals */
179         int minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
180         int numbrother,j = 0;
181         int es_interno = 1;
182         
183         NODO_B_PLUS *brother = b_plus_crearnodo(idx);
184         brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
185         
186         /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
187         /* pues el ancla se debe repetir ademas de subir */
188         if (brother->nivel == 0) {
189                 brother->cant_claves = minclaves+1;
190                 es_interno = 0;
191         }
192         else brother->cant_claves = minclaves;
193         
194         /* Copio las claves al brother derecho */
195         for (j = 0; j < brother->cant_claves; ++j)
196                 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
197         
198         /* Copio los hijos ya sea para hoja o no hoja. */
199         for (j = 0; j < brother->cant_claves+1; ++j)
200                 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
201         
202         /* Ahora me ocupo del nodo que se partio */
203         fullnode->cant_claves = minclaves;
204         /* Obtengo numero de nodo para brother y encadeno si es hoja */
205         numbrother = b_plus_get_num_nodo(idx);
206         if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
207         
208         /* Ahora fixeamos el padre, apuntando al nuevo hijo */
209         for (j = parent->cant_claves; j > ithchild; --j)
210                 parent->hijos[j+1] = parent->hijos[j];
211         parent->hijos[ithchild+1] = numbrother;
212         
213         /* Idem pero subo la median key */
214         for (j = parent->cant_claves-1; j >= ithchild; --j)
215                 parent->claves[j+1] = parent->claves[j];
216         parent->claves[ithchild] = fullnode->claves[minclaves];
217         parent->cant_claves++;
218         
219         /* Grabo los nodos en disco */
220         b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
221         b_plus_grabar_nodo(idx,brother,numbrother);
222         b_plus_grabar_nodo(idx,parent,numparent);
223         
224         b_plus_destruir_nodo(brother);
225         
226         return 0;
227 }
228
229
230 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
231 {
232     int i, num_nodo_hijo;
233     NODO_B_PLUS *hijo;
234     
235     i = nodo->cant_claves-1; 
236     if ( nodo->nivel == 0 ){
237         while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ){
238             nodo->claves[i+1] = nodo->claves[i];
239                         nodo->hijos[i+2] = nodo->hijos[i+1];
240                         nodo->hijos[i+1] = nodo->hijos[i];
241             i--;
242         }
243         nodo->claves[i+1] = query->clave;
244                 nodo->hijos[i+1] = query->num_bloque;
245         nodo->cant_claves++;
246         b_plus_grabar_nodo(idx, nodo, num_nodo);
247     } else { 
248         while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) 
249             i--;
250         i++;
251         num_nodo_hijo = nodo->hijos[i];
252         hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
253         if ( hijo->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
254             b_plus_split_child(idx, num_nodo, nodo, i, hijo);
255             if ( query->clave.i_clave > nodo->claves[i].i_clave )
256                 i++;
257         }
258                 if (hijo) b_plus_destruir_nodo(hijo);
259                 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
260         b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
261                 if (hijo) b_plus_destruir_nodo(hijo);   
262     }
263         
264         return 0;
265 }    
266
267 int emufs_b_plus_insertar(INDICE *idx, INDEX_DAT *query)
268 {
269     NODO_B_PLUS *raiz;
270     
271     raiz = b_plus_leer_nodo(idx, 0);
272     if ( raiz->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
273         NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
274         new_root->nivel = raiz->nivel + 1;
275         new_root->hijos[0] = b_plus_get_num_nodo(idx);
276         b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
277         b_plus_grabar_nodo(idx, new_root, 0);
278             b_plus_split_child(idx, 0, new_root, 0, raiz);
279         b_plus_insert_nonfull(idx, new_root, 0, query);
280                 b_plus_destruir_nodo(new_root);
281     } else 
282         {
283                 b_plus_insert_nonfull(idx, raiz, 0, query);
284         }
285         
286         b_plus_destruir_nodo(raiz);
287     
288     return 0;
289 }
290
291 /** Busca una clave dentro del arbol e indica si existe o no
292  *  Posibilidades: return 1 - Encontro la clave
293  *                 return 0 - No encontro la clave
294  *                 return -1 - Hubo falla de lectura de un nodo, Abortar
295  */
296 int b_plus_existe_clave(INDICE *idx, INDEX_DAT *query, int num_node)
297 {
298         int i,exitcode = 0;
299         NODO_B_PLUS *nodo;
300         nodo = b_plus_leer_nodo(idx,num_node);
301         if (nodo == NULL) return -1;
302         i = nodo->cant_claves - 1;
303                 
304         /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
305         if (nodo->nivel == 0) {
306         /* Vemos si esta la clave */
307                 while ( i >= 0 && query->clave.i_clave != nodo->claves[i].i_clave ) i--;
308                 if (i < 0)
309                 {
310                         b_plus_destruir_nodo(nodo);
311                         return 0; /* No encontre la clave */
312                 } else  {
313                         /* Encontre la clave, guardo el nodo donde esta! */
314                         query->num_bloque = num_node;
315                         b_plus_destruir_nodo(nodo);
316                         return 1;
317                 }
318         }
319         else {
320                 /* Buscamos por donde descender al siguiente nivel */
321                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
322         i++;
323         num_node = nodo->hijos[i];
324                 b_plus_destruir_nodo(nodo);
325                 exitcode = b_plus_existe_clave(idx,query,num_node);
326                 return exitcode;
327         }
328 }
329
330 int b_plus_cant_claves_nodo(INDICE *idx, int num_node)
331 {
332         NODO_B_PLUS *nodo =     b_plus_leer_nodo(idx,num_node);
333         if (nodo == NULL) return -1;
334         return nodo->cant_claves;
335 }
336
337 /* Search_Type: 0 - Predecesor, 1 - Sucesor
338    Exitcode: 1 - Encontre lo buscado, 0 - No lo encontre, -1 Error */
339 int b_plus_buscar_prepost(INDICE *idx, CLAVE key, int num_node, INDEX_DAT *prepostkey, int search_type)
340 {
341         int i = 0, exitcode = 0;
342         NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);             
343         if (nodo == NULL) return -1;
344         i = nodo->cant_claves - 1;
345         
346         if (nodo->nivel == 0) {         
347                 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;          
348                 switch (search_type) {                  
349                         /* Busco predecesor en la hoja */                       
350                         case 0: if (i <= 0) exitcode = 0;
351                                         else {                                          
352                                                 if (nodo->claves[i].i_clave == key.i_clave)     {
353                                                         prepostkey->clave = nodo->claves[i-1];
354                                                         prepostkey->num_bloque = nodo->hijos[i-1];
355                                                 } else {
356                                                         prepostkey->clave = nodo->claves[i];
357                                                         prepostkey->num_bloque = nodo->hijos[i];
358                                                 }
359                                                 exitcode = 1;
360                                         }
361                                         break;                                  
362                         /* Busco sucesor en la hoja */                                                          
363                         case 1: if ((nodo->claves[i].i_clave == key.i_clave) && (i == nodo->cant_claves-1)) exitcode = 0;
364                                         else {                                          
365                                                 prepostkey->clave = nodo->claves[i+1];
366                                                 prepostkey->num_bloque = nodo->hijos[i+i];
367                                                 exitcode = 1;
368                                         }
369                                         break;
370                 }                                                                                                                               
371         } else {
372                 /* Veo por que rama debo seguir buscando el pre o post */
373                 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;          
374                 if (search_type == 0) {
375                         if (i < 0) exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
376                         else {
377                                 /* Busco primero por la rama derecha, sino por la izquierda */
378                                 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
379                                 if (exitcode == 0)                      
380                                         exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i],prepostkey,search_type);
381                         }
382                         /* Handleo busqueda de clave menor o igual que todas */
383                         if (exitcode == 0) exitcode = -1;
384                 } else  {
385                         /* Busco un sucesor, y funciona como getbloque... */                    
386                         exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
387                         /* Veo si tengo que devolver la clave izquierda del padre del que acabo de buscar */
388                         if (exitcode == 0) {
389                                 if (i < nodo->cant_claves-1) {
390                                         prepostkey->clave = nodo->claves[i+1];
391                                         exitcode = 1;
392                                 } else  exitcode = -1;
393                         }
394                 }               
395         }
396         
397         /* Libero y devuelvo exitcode */
398         b_plus_destruir_nodo(nodo);
399         return(exitcode);               
400 }
401
402 int b_plus_reemplazar_clave(INDICE *idx, CLAVE key, INDEX_DAT query)
403 {
404         NODO_B_PLUS *nodo;
405         int i;
406         INDEX_DAT auxquery;
407         auxquery.clave = key;
408                 
409         /* Comienzo buscando la clave y obteniendo el nodo en donde esta */
410         if (b_plus_existe_clave(idx,&auxquery,0) == 1) {                                        
411                 
412                 /* Levanto el nodo y busco donde esta la clave */               
413                 printf("El reemplazar encontro la clave %i y en el nodo %i\n",auxquery.clave.i_clave,(int)auxquery.num_bloque);
414                 nodo = b_plus_leer_nodo(idx,auxquery.num_bloque);
415                 if (nodo == NULL) return -1;
416                 i = nodo->cant_claves - 1;
417                 
418                 /* Busco la clave y reemplazo */
419                 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
420                 if (i < 0) return -1; /* Error, no esta la clave */
421                 
422                 /* Cheque por las dudas si es hoja o interno, aunque deberia ser hoja */
423                 if (nodo->nivel > 0) {                  
424                         nodo->claves[i] = query.clave;
425                 } else {
426                         nodo->claves[i] = query.clave;
427                         nodo->hijos[i] = query.num_bloque;
428                 }
429                 b_plus_grabar_nodo(idx,nodo,auxquery.num_bloque);
430                 b_plus_destruir_nodo(nodo);
431                 return 0;
432         }
433         else return -1;
434 }
435
436 int emufs_b_plus_eliminar(INDICE *idx, CLAVE key, int num_node)
437 {
438         INDEX_DAT prekey;
439         int i = 0,j = 0,minclaves = 0, cant_claves_child = 0;
440         NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);             
441         if (nodo == NULL) return -1;
442         i = nodo->cant_claves - 1;
443         minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
444
445         /* Si es hoja, borro directamente la clave. No se producira underflow
446        pues lo asegura la recursividad del delete */    
447         if (nodo->nivel == 0) {         
448                 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
449                 if (i < 0) return -1;
450                 /* Encontre la clave en la pos i, la borro */
451                 for (j = i; j < nodo->cant_claves-1; ++j) {
452                         nodo->claves[j] = nodo->claves[j+1];
453                         nodo->hijos[j] = nodo->hijos[j+1];
454                 }
455                 nodo->hijos[j] = nodo->hijos[j+1];
456         nodo->cant_claves--;
457                 
458                 /* Grabo el nodo actualizado en disco */
459                 b_plus_grabar_nodo(idx,nodo,num_node);
460                 b_plus_destruir_nodo(nodo);
461                 return 0;
462         } else {
463                 /* Me debo fijar si esta la clave en este nodo interno, sino busco */           
464                 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
465                 if (i < 0) {
466                         /* No esta en este nodo interno, caso 3 */
467                 } else {
468                         /* Esta en el nodo interno, caso 2 */
469                         cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i]);
470                         if (cant_claves_child > minclaves) {
471                                 /* Caso 2a, comienzo buscando la clave previa inmediata */
472                                 b_plus_buscar_prepost(idx,key,nodo->hijos[i],&prekey,0);
473                                 /* La elimino recursivamente */
474                                 emufs_b_plus_eliminar(idx,prekey.clave,0);
475                                 /* Remplazo mi clave key por la encontrada prekey */
476                                 nodo->claves[i] = prekey.clave;
477                                 /* Remplazo la otra instancia de key en una hoja seguro por prekey */
478                                 /*emufs_b_plus_reemplazar_clave(idx,key,prekey.clave);*/
479                         } else {                                
480                                 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i+1]);
481                                 if (cant_claves_child > minclaves) {
482                                         /* Caso 2b */
483                                         
484                                 } else {
485                                         /* Caso 2c */
486                                 
487                                 }
488                         }                       
489                 }               
490         }
491         
492         return -1;
493 }
494
495 int b_plus_get_num_nodo(INDICE *idx)
496 {
497         FILE *fp;
498         int num;
499         
500         fp = fopen(idx->filename, "ab");
501         if (fp == NULL) return -1;
502     
503     num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
504         printf("Num Nodo Nuevo: %i\n",num);
505     fclose(fp);
506     return num;
507 }