]> git.llucax.com Git - z.facultad/75.06/emufs.git/blob - emufs/indice_bplus.c
* Cambios grandes para poder borrar claves en un indice con repeticion
[z.facultad/75.06/emufs.git] / emufs / indice_bplus.c
1 /** Arbol B+ */
2 #include "indices.h"
3 #include "indice_bplus.h"
4
5 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
6 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node);
7 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node);
8 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
11 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
12 int b_plus_insertar(INDICE *idx, INDEX_DAT *query);
13 int b_plus_get_num_nodo(INDICE *idx);
14 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
15
16 /** Crea un nuevo nodo y lo inicializa */
17 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx) {
18         
19         NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
20         if (nodo == NULL) return NULL;
21         nodo->nivel = 0;
22         nodo->cant_claves = 0;
23
24     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
25         nodo->claves = (CLAVE*)malloc(idx->size_claves);
26         nodo->hijos = (int*)malloc(idx->size_hijos);
27         memset(nodo->claves,-1,idx->size_claves);
28         memset(nodo->hijos,-1,idx->size_hijos);
29         
30     return nodo;        
31 }
32
33 /** Crea el archivo indice B+ */
34 int emufs_b_plus_crear(INDICE *idx) {
35         
36         FILE *fp;
37         NODO_B_PLUS *raiz;
38         int error = 0;
39                 
40         /* Creamos el archivo que contendra el indice */
41         fp = fopen(idx->filename, "w");
42         PERR("Creando indice con nodo raiz");
43         if (fp == NULL) {
44                 PERR("Error al crear el archivo");
45                 return -1;
46         }
47         fclose(fp);
48         
49         /* Creamos el nodo raiz y lo guardamos el en indice */
50         raiz = b_plus_crearnodo(idx);
51         error = b_plus_grabar_nodo(idx,raiz,0);
52         
53         /* Liberamos areas de memoria reservadas */
54         free(raiz->claves);
55         free(raiz->hijos);
56         free(raiz);
57         
58         return error;
59 }
60
61
62 /** Busca el nro de bloque donde se debe guardar un reg con clave X.
63  *  Posibilidades: return 0 - Encontro un bloque potencial
64  *                 return -1 - No hay clave, inserto clave de nuevo bloques
65  *                 return 1 - Hubo falla de lectura de un nodo, Abortar
66  */
67 int emufs_b_plus_get_bloque(INDICE *idx, INDEX_DAT *query, int num_node) {
68
69         int i,exitcode = 0;
70         NODO_B_PLUS *nodo;
71         nodo = b_plus_leer_nodo(idx,num_node);
72         if (nodo == NULL) return 1;
73         i = nodo->cant_claves - 1;
74                 
75         /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
76         if (nodo->nivel == 0) {
77         /* Vemos en que bloque deberia ir */
78                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
79                 if (i < 0) {
80                         /* La clave es menor que todas, debo insertarla */
81                         b_plus_destruir_nodo(nodo);                     
82                         emufs_b_plus_insertar(idx,query);                       
83                         return -1;
84                 }
85                 else {
86                         /* Encontre un bloque potencial */
87                         query->num_bloque = nodo->hijos[i];
88                         b_plus_destruir_nodo(nodo);                     
89                         return 0;
90                 }
91         }
92         else {
93                 /* Buscamos por donde descender al siguiente nivel */
94                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
95         i++;
96         num_node = nodo->hijos[i];
97                 b_plus_destruir_nodo(nodo);
98                 exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
99                 return exitcode;                
100         }
101 }
102
103 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node) {
104
105         /*int i = 0;*/
106         FILE *fp;
107         NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
108         char *disknode = (char*)malloc(idx->tam_bloque);
109         
110         if (num_node < 0) {
111                 PERR("Se intento leer nodo negativo!!\n");
112                 exit(1);
113         }
114         if (disknode == NULL) return NULL;
115         if (memnode == NULL) return NULL;
116         
117     /* Open up file */
118         fp = fopen(idx->filename, "r+");
119         if (fp == NULL) {
120                 free(disknode);
121                 b_plus_destruir_nodo(memnode);
122                 return NULL;
123         }
124
125         /* Intentamos leer un nodo, sino podemos error! */
126         fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
127         if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
128                 free(disknode);
129                 fclose(fp);
130                 return NULL;
131         }
132         fclose(fp);
133         
134         /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
135         memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
136         memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
137         memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
138         free(disknode);
139         
140         /*printf("Dumping Node_%i\n",num_node);
141         printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
142         printf("Claves:");
143         for (i = 0; i < idx->size_claves/sizeof(CLAVE); ++i) printf(" %i",memnode->claves[i].i_clave);
144         printf("\nHijos:");
145         for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
146         printf("\nEnd Dump\n"); */
147         
148         return memnode;
149         
150 }
151
152 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node)
153 {
154         FILE *fp;
155         
156         fp = fopen(idx->filename, "r+");
157         if (fp == NULL) return -1;
158                 
159         fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);      
160         fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
161         fwrite(nodo->claves,idx->size_claves,1,fp);
162         fwrite(nodo->hijos,idx->size_hijos,1,fp);
163         fclose(fp);
164         
165         return 0;
166 }
167
168 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
169 {
170         free(nodo->claves);
171         free(nodo->hijos);
172         free(nodo);
173         return 0;
174 }
175
176 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
177 {
178         /* locals */
179         int minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
180         int numbrother,j = 0;
181         int es_interno = 1;
182         
183         NODO_B_PLUS *brother = b_plus_crearnodo(idx);
184         brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
185         
186         /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
187         /* pues el ancla se debe repetir ademas de subir */
188         if (brother->nivel == 0) {
189                 brother->cant_claves = minclaves+1;
190                 es_interno = 0;
191         }
192         else brother->cant_claves = minclaves;
193         
194         /* Copio las claves al brother derecho */
195         for (j = 0; j < brother->cant_claves; ++j)
196                 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
197         
198         /* Copio los hijos ya sea para hoja o no hoja. */
199         for (j = 0; j < brother->cant_claves+1; ++j)
200                 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
201         
202         /* Ahora me ocupo del nodo que se partio */
203         fullnode->cant_claves = minclaves;
204         /* Obtengo numero de nodo para brother y encadeno si es hoja */
205         numbrother = b_plus_get_num_nodo(idx);
206         if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
207         
208         /* Ahora fixeamos el padre, apuntando al nuevo hijo */
209         for (j = parent->cant_claves; j > ithchild; --j)
210                 parent->hijos[j+1] = parent->hijos[j];
211         parent->hijos[ithchild+1] = numbrother;
212         
213         /* Idem pero subo la median key */
214         for (j = parent->cant_claves-1; j >= ithchild; --j)
215                 parent->claves[j+1] = parent->claves[j];
216         parent->claves[ithchild] = fullnode->claves[minclaves];
217         parent->cant_claves++;
218         
219         /* Grabo los nodos en disco */
220         b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
221         b_plus_grabar_nodo(idx,brother,numbrother);
222         b_plus_grabar_nodo(idx,parent,numparent);
223         
224         b_plus_destruir_nodo(brother);
225         
226         return 0;
227 }
228
229
230 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
231 {
232     int i, num_nodo_hijo;
233     NODO_B_PLUS *hijo;
234     
235     i = nodo->cant_claves-1; 
236     if ( nodo->nivel == 0 ){
237         while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ){
238             nodo->claves[i+1] = nodo->claves[i];
239                         nodo->hijos[i+2] = nodo->hijos[i+1];
240                         nodo->hijos[i+1] = nodo->hijos[i];
241             i--;
242         }
243         nodo->claves[i+1] = query->clave;
244                 nodo->hijos[i+1] = query->num_bloque;
245         nodo->cant_claves++;
246         b_plus_grabar_nodo(idx, nodo, num_nodo);
247     } else { 
248         while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) 
249             i--;
250         i++;
251         num_nodo_hijo = nodo->hijos[i];
252         hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
253         if ( hijo->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
254             b_plus_split_child(idx, num_nodo, nodo, i, hijo);
255             if ( query->clave.i_clave > nodo->claves[i].i_clave )
256                 i++;
257         }
258                 if (hijo) b_plus_destruir_nodo(hijo);
259                 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
260         b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
261                 if (hijo) b_plus_destruir_nodo(hijo);   
262     }
263         
264         return 0;
265 }    
266
267 int emufs_b_plus_insertar(INDICE *idx, INDEX_DAT *query)
268 {
269     NODO_B_PLUS *raiz;
270     
271     raiz = b_plus_leer_nodo(idx, 0);
272     if ( raiz->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
273         NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
274         new_root->nivel = raiz->nivel + 1;
275         new_root->hijos[0] = b_plus_get_num_nodo(idx);
276         b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
277         b_plus_grabar_nodo(idx, new_root, 0);
278             b_plus_split_child(idx, 0, new_root, 0, raiz);
279         b_plus_insert_nonfull(idx, new_root, 0, query);
280                 b_plus_destruir_nodo(new_root);
281     } else 
282         {
283                 b_plus_insert_nonfull(idx, raiz, 0, query);
284         }
285         
286         b_plus_destruir_nodo(raiz);
287     
288     return 0;
289 }
290
291 /** Busca una clave dentro del arbol e indica si existe o no
292  *  Posibilidades: return 1 - Encontro la clave
293  *                 return 0 - No encontro la clave
294  *                 return -1 - Hubo falla de lectura de un nodo, Abortar
295  */
296 int b_plus_existe_clave(INDICE *idx, INDEX_DAT *query, int num_node)
297 {
298         int i,exitcode = 0;
299         NODO_B_PLUS *nodo;
300         nodo = b_plus_leer_nodo(idx,num_node);
301         if (nodo == NULL) return -1;
302         i = nodo->cant_claves - 1;
303                 
304         /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
305         if (nodo->nivel == 0) {
306         /* Vemos en que bloque deberia ir */
307                 while ( i >= 0 && query->clave.i_clave != nodo->claves[i].i_clave ) i--;
308                 b_plus_destruir_nodo(nodo);
309                 if (i < 0) return 0; /* No encontre la clave */
310                 else return 1; /* Encontre la clave */                  
311         }
312         else {
313                 /* Buscamos por donde descender al siguiente nivel */
314                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
315         i++;
316         num_node = nodo->hijos[i];
317                 b_plus_destruir_nodo(nodo);
318                 exitcode = b_plus_existe_clave(idx,query,num_node);
319                 return exitcode;
320         }
321 }
322
323 int b_plus_cant_claves_nodo(INDICE *idx, int num_node)
324 {
325         NODO_B_PLUS *nodo =     b_plus_leer_nodo(idx,num_node);
326         if (nodo == NULL) return -1;
327         return nodo->cant_claves;
328 }
329
330 /* Search_Type: 0 - Predecesor, 1 - Sucesor
331    Exitcode: 1 - Encontre lo buscado, 0 - No lo encontre, -1 Error */
332 int b_plus_buscar_prepost(INDICE *idx, CLAVE key, int num_node, CLAVE *prepostkey, int search_type)
333 {
334         int i = 0, exitcode = 0;
335         NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);             
336         if (nodo == NULL) return -1;
337         i = nodo->cant_claves - 1;
338         
339         if (nodo->nivel == 0) {
340                 printf ("Entre en hoja nro %i\n",num_node);
341                 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;          
342                 switch (search_type) {
343                         
344                         /* Busco predecesor en la hoja */                       
345                         case 0: if (i <= 0) exitcode = 0;
346                                         else {                                          
347                                                 if (nodo->claves[i].i_clave == key.i_clave)     *prepostkey = nodo->claves[i-1];
348                                                 else *prepostkey = nodo->claves[i];                                             
349                                                 exitcode = 1;
350                                         }
351                                         break;
352
353                         /* Busco sucesor en la hoja */                                                          
354                         case 1: if ((nodo->claves[i].i_clave == key.i_clave) && (i == nodo->cant_claves-1)) exitcode = 0;
355                                         else {
356                                                 *prepostkey = nodo->claves[i+1];
357                                                 exitcode = 1;
358                                         }
359                                         break;
360                 }                                                                                                                               
361         } else {
362                 /* Veo por que rama debo seguir buscando el pre o post */
363                 while ( i >= 0 && key.i_clave < nodo->claves[i].i_clave ) --i;          
364                 if (search_type == 0) {
365                         if (i < 0) exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
366                         else {
367                                 /* Busco primero por la rama derecha, sino por la izquierda */
368                                 exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
369                                 if (exitcode == 0)                      
370                                         exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i],prepostkey,search_type);
371                         }
372                         /* Handleo busqueda de clave menor o igual que todas */
373                         if (exitcode == 0) exitcode = -1;
374                 } else  {
375                         /* Busco un sucesor, y funciona como getbloque... */
376                         printf("Voy a buscar en hijo nro: %i\n",nodo->hijos[i+1]);
377                         exitcode = b_plus_buscar_prepost(idx,key,nodo->hijos[i+1],prepostkey,search_type);
378                         /* Veo si tengo que devolver la clave izquierda del padre del que acabo de buscar */
379                         if (exitcode == 0)
380                                 if (i < nodo->cant_claves-1) {
381                                         *prepostkey = nodo->claves[i+1];
382                                         exitcode = 1;
383                                 } else  exitcode = -1;
384                 }               
385         }
386         
387         /* Libero y devuelvo exitcode */
388         b_plus_destruir_nodo(nodo);
389         return(exitcode);               
390 }
391
392 int emufs_b_plus_eliminar(INDICE *idx, CLAVE key, int num_node)
393 {
394         int i = 0,j = 0,minclaves = 0, cant_claves_child = 0;
395         NODO_B_PLUS *nodo = b_plus_leer_nodo(idx,num_node);             
396         if (nodo == NULL) return -1;
397         i = nodo->cant_claves - 1;
398         minclaves = ceil(idx->size_hijos/sizeof(CLAVE)/2)-1;
399
400         /* Si es hoja, borro directamente la clave. No se producira underflow
401        pues lo asegura la recursividad del delete */    
402         if (nodo->nivel == 0) {         
403                 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
404                 if (i < 0) return -1;
405                 /* Encontre la clave en la pos i, la borro */
406                 for (j = i; j < nodo->cant_claves-1; ++j) {
407                         nodo->claves[j] = nodo->claves[j+1];
408                         nodo->hijos[j] = nodo->hijos[j+1];
409                 }
410                 nodo->hijos[j] = nodo->hijos[j+1];
411         nodo->cant_claves--;
412                 
413                 /* Grabo el nodo actualizado en disco */
414                 b_plus_grabar_nodo(idx,nodo,num_node);
415                 b_plus_destruir_nodo(nodo);
416                 return 0;
417         } else {
418                 /* Me debo fijar si esta la clave en este nodo interno, sino busco */           
419                 while ( i >= 0 && key.i_clave != nodo->claves[i].i_clave ) --i;
420                 if (i < 0) {
421                         /* No esta en este nodo interno, caso 3 */      
422                 } else {
423                         /* Esta en el nodo interno, caso 2 */
424                         cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i]);
425                         if (cant_claves_child > minclaves) {
426                                 /* Caso 2a */
427                                                                 
428                         } else {                                
429                                 cant_claves_child = b_plus_cant_claves_nodo(idx,nodo->hijos[i+1]);
430                                 if (cant_claves_child > minclaves) {
431                                         /* Caso 2b */
432                                         
433                                 } else {
434                                         /* Caso 2c */
435                                 
436                                 }
437                         }
438                         
439                         
440                 }               
441         }
442         
443         return -1;
444 }
445
446 int b_plus_get_num_nodo(INDICE *idx)
447 {
448         FILE *fp;
449         int num;
450         
451         fp = fopen(idx->filename, "ab");
452         if (fp == NULL) return -1;
453     
454     num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
455         printf("Num Nodo Nuevo: %i\n",num);
456     fclose(fp);
457     return num;
458 }