]> git.llucax.com Git - z.facultad/75.06/emufs.git/blob - emufs/indice_bplus.c
23a6f31379919b8895a2164e0c89dc93f291ef6a
[z.facultad/75.06/emufs.git] / emufs / indice_bplus.c
1 /** Arbol B+ */
2 #include "indices.h"
3 #include "indice_bplus.h"
4
5 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
6 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node);
7 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node);
8 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
11 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
12 int b_plus_insertar(INDICE *idx, INDEX_DAT *query);
13 int b_plus_get_num_nodo(INDICE *idx);
14 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
15
16 /** Crea un nuevo nodo y lo inicializa */
17 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx) {
18         
19         NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
20         if (nodo == NULL) return NULL;
21         nodo->nivel = 0;
22         nodo->cant_claves = 0;
23
24     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
25         nodo->claves = (CLAVE*)malloc(idx->size_claves);
26         nodo->hijos = (int*)malloc(idx->size_hijos);
27         memset(nodo->claves,-1,idx->size_claves);
28         memset(nodo->hijos,-1,idx->size_hijos);
29         
30     return nodo;        
31 }
32
33 /** Crea el archivo indice B+ */
34 int emufs_b_plus_crear(INDICE *idx) {
35         
36         FILE *fp;
37         NODO_B_PLUS *raiz;
38         int error = 0;
39                 
40         /* Creamos el archivo que contendra el indice */
41         fp = fopen(idx->filename, "w");
42         PERR("Creando indice con nodo raiz");
43         if (fp == NULL) {
44                 PERR("Error al crear el archivo");
45                 return -1;
46         }
47         fclose(fp);
48         
49         /* Creamos el nodo raiz y lo guardamos el en indice */
50         raiz = b_plus_crearnodo(idx);
51         error = b_plus_grabar_nodo(idx,raiz,0);
52         
53         /* Liberamos areas de memoria reservadas */
54         free(raiz->claves);
55         free(raiz->hijos);
56         free(raiz);
57         
58         return error;
59 }
60
61
62 /** Busca el nro de bloque donde se debe guardar un reg con clave X.
63  *  Posibilidades: return 0 - Encontro un bloque potencial
64  *                 return -1 - No hay clave, inserto clave de nuevo bloques
65  *                 return 1 - Hubo falla de lectura de un nodo, Abortar
66  */
67 int emufs_b_plus_get_bloque(INDICE *idx, INDEX_DAT *query, int num_node) {
68
69         int i,exitcode = 0;
70         NODO_B_PLUS *nodo;
71         nodo = b_plus_leer_nodo(idx,num_node);
72         if (nodo == NULL) return 1;
73         i = nodo->cant_claves - 1;
74                 
75         /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
76         if (nodo->nivel == 0) {
77         /* Vemos en que bloque deberia ir */
78                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
79                 if (i < 0) {
80                         /* La clave es menor que todas, debo insertarla */
81                         b_plus_destruir_nodo(nodo);                     
82                         emufs_b_plus_insertar(idx,query);                       
83                         return -1;
84                 }
85                 else {
86                         /* Encontre un bloque potencial */
87                         query->num_bloque = nodo->hijos[i];
88                         b_plus_destruir_nodo(nodo);                     
89                         return 0;
90                 }
91         }
92         else {
93                 /* Buscamos por donde descender al siguiente nivel */
94                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
95         i++;
96         num_node = nodo->hijos[i];
97                 b_plus_destruir_nodo(nodo);
98                 exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
99                 return exitcode;                
100         }
101 }
102
103 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node) {
104
105         /*int i = 0;*/
106         FILE *fp;
107         NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
108         char *disknode = (char*)malloc(idx->tam_bloque);
109         
110         if (num_node < 0) {
111                 PERR("Se intento leer nodo negativo!!\n");
112                 exit(1);
113         }
114         if (disknode == NULL) return NULL;
115         if (memnode == NULL) return NULL;
116         
117     /* Open up file */
118         fp = fopen(idx->filename, "r+");
119         if (fp == NULL) {
120                 free(disknode);
121                 b_plus_destruir_nodo(memnode);
122                 return NULL;
123         }
124
125         /* Intentamos leer un nodo, sino podemos error! */
126         fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
127         if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
128                 free(disknode);
129                 fclose(fp);
130                 return NULL;
131         }
132         fclose(fp);
133         
134         /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
135         memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
136         memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
137         memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
138         free(disknode);
139         
140         /*printf("Dumping Node_%i\n",num_node);
141         printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
142         printf("Claves:");
143         for (i = 0; i < idx->size_claves/sizeof(CLAVE); ++i) printf(" %i",memnode->claves[i].i_clave);
144         printf("\nHijos:");
145         for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
146         printf("\nEnd Dump\n"); */
147         
148         return memnode;
149         
150 }
151
152 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node)
153 {
154         FILE *fp;
155         
156         fp = fopen(idx->filename, "r+");
157         if (fp == NULL) return -1;
158                 
159         fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);      
160         fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
161         fwrite(nodo->claves,idx->size_claves,1,fp);
162         fwrite(nodo->hijos,idx->size_hijos,1,fp);
163         fclose(fp);
164         
165         return 0;
166 }
167
168 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
169 {
170         free(nodo->claves);
171         free(nodo->hijos);
172         free(nodo);
173         return 0;
174 }
175
176 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
177 {
178         /* locals */
179         int minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
180         int numbrother,j = 0;
181         int es_interno = 1;
182         
183         NODO_B_PLUS *brother = b_plus_crearnodo(idx);
184         brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
185         
186         /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
187         /* pues el ancla se debe repetir ademas de subir */
188         if (brother->nivel == 0) {
189                 brother->cant_claves = minclaves+1;
190                 es_interno = 0;
191         }
192         else brother->cant_claves = minclaves;
193         
194         /* Copio las claves al brother derecho */
195         for (j = 0; j < brother->cant_claves; ++j)
196                 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
197         
198         /* Copio los hijos ya sea para hoja o no hoja. */
199         for (j = 0; j < brother->cant_claves+1; ++j)
200                 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
201         
202         /* Ahora me ocupo del nodo que se partio */
203         fullnode->cant_claves = minclaves;
204         /* Obtengo numero de nodo para brother y encadeno si es hoja */
205         numbrother = b_plus_get_num_nodo(idx);
206         if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
207         
208         /* Ahora fixeamos el padre, apuntando al nuevo hijo */
209         for (j = parent->cant_claves; j > ithchild; --j)
210                 parent->hijos[j+1] = parent->hijos[j];
211         parent->hijos[ithchild+1] = numbrother;
212         
213         /* Idem pero subo la median key */
214         for (j = parent->cant_claves-1; j >= ithchild; --j)
215                 parent->claves[j+1] = parent->claves[j];
216         parent->claves[ithchild] = fullnode->claves[minclaves];
217         parent->cant_claves++;
218         
219         /* Grabo los nodos en disco */
220         b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
221         b_plus_grabar_nodo(idx,brother,numbrother);
222         b_plus_grabar_nodo(idx,parent,numparent);
223         
224         b_plus_destruir_nodo(brother);
225         
226         return 0;
227 }
228
229
230 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
231 {
232     int i, num_nodo_hijo;
233     NODO_B_PLUS *hijo;
234     
235     i = nodo->cant_claves-1; 
236     if ( nodo->nivel == 0 ){
237         while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ){
238             nodo->claves[i+1] = nodo->claves[i];
239                         nodo->hijos[i+2] = nodo->hijos[i+1];
240                         nodo->hijos[i+1] = nodo->hijos[i];
241             i--;
242         }
243         nodo->claves[i+1] = query->clave;
244                 nodo->hijos[i+1] = query->num_bloque;
245         nodo->cant_claves++;
246         b_plus_grabar_nodo(idx, nodo, num_nodo);
247     } else { 
248         while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) 
249             i--;
250         i++;
251         num_nodo_hijo = nodo->hijos[i];
252         hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
253         if ( hijo->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
254             b_plus_split_child(idx, num_nodo, nodo, i, hijo);
255             if ( query->clave.i_clave > nodo->claves[i].i_clave )
256                 i++;
257         }
258                 if (hijo) b_plus_destruir_nodo(hijo);
259                 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
260         b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
261                 if (hijo) b_plus_destruir_nodo(hijo);   
262     }
263         
264         return 0;
265 }    
266
267 int emufs_b_plus_insertar(INDICE *idx, INDEX_DAT *query)
268 {
269     NODO_B_PLUS *raiz;
270     
271     raiz = b_plus_leer_nodo(idx, 0);
272     if ( raiz->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
273         NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
274         new_root->nivel = raiz->nivel + 1;
275         new_root->hijos[0] = b_plus_get_num_nodo(idx);
276         b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
277         b_plus_grabar_nodo(idx, new_root, 0);
278             b_plus_split_child(idx, 0, new_root, 0, raiz);
279         b_plus_insert_nonfull(idx, new_root, 0, query);
280                 b_plus_destruir_nodo(new_root);
281     } else 
282         {
283                 b_plus_insert_nonfull(idx, raiz, 0, query);
284         }
285         
286         b_plus_destruir_nodo(raiz);
287     
288     return 0;
289 }
290
291 /** Busca una clave dentro del arbol e indica si existe o no
292  *  Posibilidades: return 1 - Encontro la clave
293  *                 return 0 - No encontro la clave
294  *                 return -1 - Hubo falla de lectura de un nodo, Abortar
295  */
296 int b_plus_existe_clave(INDICE *idx, INDEX_DAT *query, int num_node)
297 {
298         int i,exitcode = 0;
299         NODO_B_PLUS *nodo;
300         nodo = b_plus_leer_nodo(idx,num_node);
301         if (nodo == NULL) return -1;
302         i = nodo->cant_claves - 1;
303                 
304         /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
305         if (nodo->nivel == 0) {
306         /* Vemos en que bloque deberia ir */
307                 while ( i >= 0 && query->clave.i_clave != nodo->claves[i].i_clave ) i--;
308                 if (i < 0) return 0; /* No encontre la clave */
309                 else return 1; /* Encontre la clave */                  
310         }
311         else {
312                 /* Buscamos por donde descender al siguiente nivel */
313                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
314         i++;
315         num_node = nodo->hijos[i];
316                 b_plus_destruir_nodo(nodo);
317                 exitcode = b_plus_existe_clave(idx,query,num_node);
318                 return exitcode;
319         }
320 }
321
322 int b_plus_cant_claves_nodo(INDICE *idx, int num_node)
323 {
324         NODO_B_PLUS *nodo =     b_plus_leer_nodo(idx,num_node);
325         if (nodo == NULL) return -1;
326         return nodo->cant_claves;
327 }
328
329 /* Search_Type: 0 - Predecesor, 1 - Sucesor
330    Exitcode: 1 - Encontre lo buscado, 0 - No lo encontre */
331 int b_plus_buscar_prepost(INDICE *idx, CLAVE key, int num_node, CLAVE *prepostkey, int search_type)
332 {
333         int i = 0, j = 0;
334         NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);             
335         if (nodo == NULL) return -1;
336         i = nodo->cant_claves - 1;
337         
338         if (nodo->nivel == 0) {
339                 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;
340                 /* Busco predecesor en la hoja */       
341                 switch (search_type) {
342                         
343                         case 0: if (i < 0) return 0;
344                                         else {
345                                                 *prepostkey = nodo->claves[i];
346                                                 return 1;
347                                         }
348                                         break;
349                                         
350                         case 1: if (nodo->claves[i].i_clave == key.i_clave) return 0;
351                                         else {
352                                                 *prepostkey = nodo->claves[i+1];
353                                                 return 1;
354                                         }
355                                         break;
356                 }
357                                                                                                         
358                 /* Busco sucesor en la hoja */  
359                 if ((search_type == 1) && (i < 0)) return 0;
360                 else if (i >= 0) {
361                                 *prepostkey = nodo->claves[i];
362                                 return 1;
363                 }                               
364         } else {
365                 /* Veo por que rama debo seguir buscando el pre o post */
366                 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;          
367                 if (search_type == 0) {
368                         if (i < 0) exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
369                         else {
370                                 /* Busco primero por la rama derecha, sino por la izquierda */
371                                 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+2],prepostkey,search_type);
372                                 if (exitcode == 0) exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);                                                           
373                         }
374                 } else  {
375                         /* Busco un sucesor, y funciona como getbloque... */
376                         exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
377                         if (exitcode == 0) {
378                                 *prepostkey = nodo->claves[i+1];
379                                 exitcode = 1;
380                         }
381                 }
382                         
383         }
384         
385         return exitcode;
386 }
387
388 int emufs_b_plus_eliminar(INDICE *idx, CLAVE key, int num_node)
389 {
390         int i = 0,j = 0,minclaves = 0, cant_claves_child = 0;
391         NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);             
392         if (nodo == NULL) return -1;
393         i = nodo->cant_claves - 1;
394         minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
395
396         /* Si es hoja, borro directamente la clave. No se producira underflow
397        pues lo asegura la recursividad del delete */    
398         if (nodo->nivel == 0) {         
399                 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
400                 if (i < 0) return -1;
401                 /* Encontre la clave en la pos i, la borro */
402                 for (j = i; j < nodo->cant_claves-1; ++j) {
403                         nodo->claves[j] = nodo->claves[j+1];
404                         nodo->hijos[j] = nodo->hijos[j+1];
405                 }
406                 nodo->hijos[j] = nodo->hijos[j+1];
407         nodo->cant_claves--;
408                 
409                 /* Grabo el nodo actualizado en disco */
410                 b_plus_grabar_nodo(idx,nodo,num_node);
411                 b_plus_destruir_nodo(nodo);
412                 return 0;
413         } else {
414                 /* Me debo fijar si esta la clave en este nodo interno, sino busco */           
415                 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
416                 if (i < 0) {
417                         /* No esta en este nodo interno, caso 3 */      
418                 } else {
419                         /* Esta en el nodo interno, caso 2 */
420                         cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i]);
421                         if (cant_claves_child > minclaves) {
422                                 /* Caso 2a */
423                                                                 
424                         } else {                                
425                                 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i+1]);
426                                 if (cant_claves_child > minclaves) {
427                                         /* Caso 2b */
428                                         
429                                 } else {
430                                         /* Caso 2c */
431                                 
432                                 }
433                         }
434                         
435                         
436                 }               
437         }
438         
439         return -1;
440 }
441
442 int b_plus_get_num_nodo(INDICE *idx)
443 {
444         FILE *fp;
445         int num;
446         
447         fp = fopen(idx->filename, "ab");
448         if (fp == NULL) return -1;
449     
450     num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
451         printf("Num Nodo Nuevo: %i\n",num);
452     fclose(fp);
453     return num;
454 }