]> git.llucax.com Git - z.facultad/75.06/emufs.git/blob - emufs/b_plus.c
Insertar B+ en teoria fully working con encadenamiento en hojas y toda la mar en...
[z.facultad/75.06/emufs.git] / emufs / b_plus.c
1 /** Arbol B+ */
2 #include "b_plus.h"
3 #include <math.h>
4
5 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
6 /* numerando los bloques */
7 int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node);
8 /*NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);*/
9 NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx);
10 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
11 /*int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query);*/
12 int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
13 int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
14 int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query);
15 int b_plus_get_num_nodo(INDEXSPECS *idx);
16 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
17
18 /** Crea un nuevo nodo y lo inicializa */
19 NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx) {
20         
21         NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
22         if (nodo == NULL) return NULL;
23         nodo->nivel = 0;
24         nodo->cant_claves = 0;
25
26     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
27         nodo->claves = (int*)malloc(idx->size_claves);
28         nodo->hijos = (int*)malloc(idx->size_hijos);
29         memset(nodo->claves,-1,idx->size_claves);
30         memset(nodo->hijos,-1,idx->size_hijos);
31         
32     return nodo;        
33 }
34
35 /** Crea el archivo indice B+ */
36 int emufs_b_plus_crear(INDEXSPECS *idx) {
37         
38         FILE *fp;
39         NODO_B_PLUS *raiz;
40         int error = 0;
41                 
42         /* Creamos el archivo que contendra el indice */
43         fp = fopen(idx->filename, "w");
44         PERR("Creando indice con nodo raiz");
45         if (fp == NULL) {
46                 PERR("Error al crear el archivo");
47                 return -1;
48         }
49         fclose(fp);
50         
51         /* Creamos el nodo raiz y lo guardamos el en indice */
52         raiz = b_plus_crearnodo(idx);
53         error = b_plus_grabar_nodo(idx,raiz,0);
54         
55         /* Liberamos areas de memoria reservadas */
56         free(raiz->claves);
57         free(raiz->hijos);
58         free(raiz);
59         
60         return error;
61 }
62
63 /* Inserta una nueva clave y reestructura el arbol para que quede como debe */
64 int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query)
65 {
66         NODO_B_PLUS *curnode, *padre;
67         int i,j, prox_nodo = 0;
68         
69         /* Comienzo leyendo la raiz, entry point de toda funcion */
70         curnode = b_plus_leer_nodo(idx,0);      
71         if (curnode == NULL) return -1;
72         padre = curnode;
73         while ( curnode->nivel > 0 && curnode ) {
74                 for(i=0; i<curnode->cant_claves; i++){ 
75                         /* me fijo que si es mayor */
76                         if ( (query->clave.i_clave > curnode->claves[i])) {
77                                 if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
78                                         continue; /*paso a la siguiente*/
79                                 else {  /* si era la ultima, la clave deberia ir ahi */
80                                         /*cargo el proximo nodo*/
81                                         prox_nodo = curnode->hijos[i+1];
82                                         break; /*salgo del for*/
83                                 }
84                         } else {  /*si no es mayor o igual es menor*/
85                                 prox_nodo = curnode->hijos[i];
86                                 break;
87                         }
88                 }
89                 padre = curnode;
90                 curnode = b_plus_leer_nodo(idx, prox_nodo);
91         } 
92         /* aca tengo el nodo donde deberia ir la clave, y su padre */ 
93         
94         if ( curnode->cant_claves < idx->size_claves/sizeof(int) ){
95                 int *claves_aux = (int*)malloc(idx->size_claves);
96                 int *hijos_aux = (int*)malloc(idx->size_hijos);
97                 memset(claves_aux,-1,idx->size_claves);
98                 memset(hijos_aux,-1,idx->size_hijos);
99                 i = 0;
100                 while ( (curnode->claves[i] < query->clave.i_clave) && (i < curnode->cant_claves)){
101                         claves_aux[i] = curnode->claves[i];
102                         hijos_aux[i] = curnode->hijos[i];
103                         i++;
104                 }
105                 curnode->cant_claves++;
106                 claves_aux[i] = query->clave.i_clave;
107                 hijos_aux[i] = query->num_bloque;
108                 for (j=i+1; j<curnode->cant_claves; j++){
109                         claves_aux[j] = curnode->claves[j-1];
110                         hijos_aux[j] = curnode->hijos[j-1];
111                 }
112                 free(curnode->claves);
113                 free(curnode->hijos);
114                 curnode->claves = claves_aux;
115                 curnode->hijos = hijos_aux;
116                 printf ("Prox Nodo es: %i\n",prox_nodo);
117                 b_plus_grabar_nodo(idx, curnode, prox_nodo);
118                 b_plus_destruir_nodo(curnode);
119         }
120                 
121         /* si el nodo esta lleno tengo que splitear */
122         if ( curnode->cant_claves == idx->size_claves ) 
123         {
124                 /**FIXME**/
125         }
126         return 0;
127 }
128
129 /** Busca el nro de bloque donde se debe guardar un reg con clave X */
130 /** Si la clave entra en la raiz, la guarda, si no, busca el nodo hoja
131     donde debe ir y devuelve el bloque (en query) pero no graba la clave */
132 /** Devuelve -1 si no hay un bloque donde insertar la nueva clave */
133 int emufs_b_plus_get_bloque(INDEXSPECS *idx, INDEX_DAT *query) {
134
135     NODO_B_PLUS *curnode;
136         int i, prox_nodo;
137         /* Comienzo leyendo la raiz, entry point de toda funcion */
138         printf ("Buscando donde insertar clave: %i\n\n",query->clave.i_clave);
139         curnode = b_plus_leer_nodo(idx,0);      
140         if (curnode == NULL) return -1;
141         /* Me fijo si la raiz esta vacia */
142         if ( curnode->cant_claves == 0 ){ /* entra la clave en la raiz */ 
143                 /* ojo que este es un caso muy particular */
144                 /* aumento la cant de claves*/
145                 curnode->cant_claves++;
146                 /* inserto la clave en el nodo, como es la primera no hace falta ordenar nada*/
147                 *(curnode->claves) = query->clave.i_clave;
148                 /* En query->num_bloque viene un numero de bloque nuevo valido..*/
149                 /* Le asigno al nodo del arbol el mismo numero que venia en query*/
150                 *(curnode->hijos) = query->num_bloque;
151                 /* Cargado el query salgo de la func, luego habra que actualizar el .dat */
152                 /*grabo el nodo en el archivo*/
153                 b_plus_grabar_nodo(idx, curnode, 0);
154                 /* librero el nodo */
155                 b_plus_destruir_nodo(curnode);
156                 return 0;
157         } 
158         PERR("TENGO LA HOJA");  
159         /* Mientras no encontre la hoja con la clave, busco.. */
160         /* RECORDAR QUE LAS CLAVES DEBEN ESTAR ORDENADAS PARA QUE ESTO FUNCIONE !! */ 
161         while (curnode->nivel > 0 && curnode){  
162                 /*recorro las claves hasta encontrar la primera mayor a la que quiero insertar*/
163                 for(i=0; i<curnode->cant_claves; i++){ 
164                         /* me fijo que si es mayor */
165                         if ( (query->clave.i_clave > curnode->claves[i])) {
166                                 if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
167                                         continue; /*paso a la siguiente*/
168                                 else {  /* si era la ultima, la clave deberia ir ahi */
169                                         /*cargo el proximo nodo*/
170                                         prox_nodo = curnode->hijos[i+1];
171                                         break; /*salgo del for*/
172                                 }
173                         } else {  /*si no es mayor o igual es menor*/
174                                 prox_nodo = curnode->hijos[i];
175                                 break;
176                         }
177                 }
178                 b_plus_destruir_nodo(curnode);
179                 curnode = b_plus_leer_nodo(idx, prox_nodo);
180         } 
181         
182         /*cuando salgo de aca deberia tener cargado en curnode el nodo hoja que busque*/
183         for (i=0; i<curnode->cant_claves-1; i++){
184                 if ( query->clave.i_clave >= curnode->claves[i] ){
185                         if ( curnode->cant_claves != i ) /* si no es la ultima clave */
186                                 continue;
187                         else {   /* si era la ultima */
188                                 /* Cargo en query el numero del bloque donde deberia ir la nueva clave */
189                                 query->num_bloque = curnode->hijos[i];
190                                 b_plus_destruir_nodo(curnode);
191                                 return 0;
192                         }
193                 } else {  /* si no era mayor, era menor */
194                         if ( i == 0 ){ 
195                                                                 
196                                 /* ACA PODRIAMOS RETORNAR -1 COMO CODIGO DE ERROR QUE INFORMARIA QUE NO EXISTE 
197                                    UN NODO DONDE QUEPA LA CLAVE, ENTONCES HABRIA QUE LLAMAR A LA FUNCION QUE
198                                    ACTUALIZA EL ARBOL Y SE ENCARGA DE ARGREGAR LA CLAVE Y HACER EL SPLIT DE SER 
199                                    NECESARIO */
200                                 /* Llamo a la funcion que mete una clave nueva en el arbol y le paso el bloque a donde 
201                                    tiene que apuntar */
202                                 b_plus_insertar_clave(idx, query);
203                                 b_plus_destruir_nodo(curnode);
204                                 return 1; /* SE INSERTO NODO NUEVO */
205                         } else {
206                                 query->num_bloque = curnode->hijos[i-1];
207                                 b_plus_destruir_nodo(curnode);
208                                 return 0;
209                         }
210                 }
211         }
212
213         if (curnode) b_plus_destruir_nodo(curnode);
214         return 0;
215 }
216
217 NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) {
218
219         int i = 0;
220         FILE *fp;
221         NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
222         char *disknode = (char*)malloc(idx->tam_bloque);
223         
224         if (num_node < 0) {
225                 PERR("Se intento leer nodo negativo!!\n");
226                 exit(1);
227         }
228         if (disknode == NULL) return NULL;
229         if (memnode == NULL) return NULL;
230         
231     /* Open up file */
232         fp = fopen(idx->filename, "r+");
233         if (fp == NULL) {
234                 free(disknode);
235                 b_plus_destruir_nodo(memnode);
236                 return NULL;
237         }
238
239         /* Intentamos leer un nodo, sino podemos error! */
240         fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
241         if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
242                 free(disknode);
243                 fclose(fp);
244                 return NULL;
245         }
246         fclose(fp);
247         
248         /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
249         memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
250         memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
251         memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
252         free(disknode);
253         
254         printf("Dumping Node_%i\n",num_node);
255         printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
256         printf("Claves:");
257         for (i = 0; i < idx->size_claves/sizeof(int); ++i) printf(" %i",memnode->claves[i]);
258         printf("\nHijos:");
259         for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
260         printf("\nEnd Dump\n"); 
261         
262         return memnode;
263         
264 }
265
266 int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node)
267 {
268         FILE *fp;
269         
270         fp = fopen(idx->filename, "r+");
271         if (fp == NULL) return -1;
272                 
273         fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);      
274         fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
275         fwrite(nodo->claves,idx->size_claves,1,fp);
276         fwrite(nodo->hijos,idx->size_hijos,1,fp);
277         fclose(fp);
278         
279         return 0;
280 }
281
282 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
283 {
284         free(nodo->claves);
285         free(nodo->hijos);
286         free(nodo);
287         return 0;
288 }
289
290 int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
291 {
292         /* locals */
293         int minclaves = ceil(idx->size_hijos/sizeof(int)/2)-1;
294         int maxhijos = idx->size_hijos/sizeof(int);
295         int numbrother,j = 0;
296         int es_interno = 1;
297         
298         NODO_B_PLUS *brother = b_plus_crearnodo(idx);
299         brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
300         
301         /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
302         /* pues el ancla se debe repetir ademas de subir */
303         if (brother->nivel == 0) {
304                 brother->cant_claves = minclaves+1;
305                 es_interno = 0;
306         }
307         else brother->cant_claves = minclaves;
308         
309         /* Copio las claves al brother derecho */
310         for (j = 0; j < brother->cant_claves; ++j)
311                 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
312         
313         /* Copio los hijos ya sea para hoja o no hoja. */
314         for (j = 0; j < brother->cant_claves+1; ++j)
315                 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
316         
317         /* Ahora me ocupo del nodo que se partio */
318         fullnode->cant_claves = minclaves;
319         /* Obtengo numero de nodo para brother y encadeno si es hoja */
320         numbrother = b_plus_get_num_nodo(idx);
321         if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
322         
323         /* Ahora fixeamos el padre, apuntando al nuevo hijo */
324         for (j = parent->cant_claves; j > ithchild; --j)
325                 parent->hijos[j+1] = parent->hijos[j];
326         parent->hijos[ithchild+1] = numbrother;
327         
328         /* Idem pero subo la median key */
329         for (j = parent->cant_claves-1; j >= ithchild; --j)
330                 parent->claves[j+1] = parent->claves[j];
331         parent->claves[ithchild] = fullnode->claves[minclaves];
332         parent->cant_claves++;
333         
334         /* Grabo los nodos en disco */
335         b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
336         b_plus_grabar_nodo(idx,brother,numbrother);
337         b_plus_grabar_nodo(idx,parent,numparent);
338         
339         b_plus_destruir_nodo(brother);
340         
341         return 0;
342 }
343
344
345 int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
346 {
347     int i, num_nodo_hijo;
348     NODO_B_PLUS *hijo;
349     
350     i = nodo->cant_claves-1; 
351     if ( nodo->nivel == 0 ){
352         while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ){
353             nodo->claves[i+1] = nodo->claves[i];
354                         nodo->hijos[i+1] = nodo->hijos[i];
355             i--;
356         }
357         nodo->claves[i+1] = query->clave.i_clave;
358                 nodo->hijos[i+1] = query->num_bloque;
359         nodo->cant_claves++;
360         b_plus_grabar_nodo(idx, nodo, num_nodo);
361     } else { 
362         while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) 
363             i--;
364         i++;
365         num_nodo_hijo = nodo->hijos[i];
366         hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
367         if ( hijo->cant_claves == idx->size_claves/sizeof(int) ) {
368             b_plus_split_child(idx, num_nodo, nodo, i, hijo);
369             if ( query->clave.i_clave > nodo->claves[i] )
370                 i++;
371         }
372                 if (hijo) b_plus_destruir_nodo(hijo);
373                 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
374         b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
375                 if (hijo) b_plus_destruir_nodo(hijo);   
376     }
377         
378         return 0;
379 }    
380
381 int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query)
382 {
383     NODO_B_PLUS *raiz;
384     
385     raiz = b_plus_leer_nodo(idx, 0);
386     if ( raiz->cant_claves == idx->size_claves/sizeof(int) ) {
387         NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
388         new_root->nivel = raiz->nivel + 1;
389         new_root->hijos[0] = b_plus_get_num_nodo(idx);
390         b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
391         b_plus_grabar_nodo(idx, new_root, 0);
392             b_plus_split_child(idx, 0, new_root, 0, raiz);
393         b_plus_insert_nonfull(idx, new_root, 0, query);
394                 b_plus_destruir_nodo(new_root);
395     } else 
396         {
397                 b_plus_insert_nonfull(idx, raiz, 0, query);
398         }
399         
400         b_plus_destruir_nodo(raiz);
401     
402     return 0;
403 }
404
405 int b_plus_get_num_nodo(INDEXSPECS *idx)
406 {
407         FILE *fp;
408         int num;
409         
410         fp = fopen(idx->filename, "ab");
411         if (fp == NULL) return -1;
412     
413     num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
414         printf("Num Nodo Nuevo: %i\n",num);
415     fclose(fp);
416     return num;
417 }