]> git.llucax.com Git - z.facultad/75.06/emufs.git/blob - emufs/b_plus.c
Minor Bug fix en insertar_non_full, plus agregado de funcion recursiva get_bloque...
[z.facultad/75.06/emufs.git] / emufs / b_plus.c
1 /** Arbol B+ */
2 #include "b_plus.h"
3 #define INDEXSPECS INDICE
4 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
5 /* numerando los bloques */
6 int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node);
7 /*NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);*/
8 NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 /*int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query);*/
11 int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
12 int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
13 int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query);
14 int b_plus_get_num_nodo(INDEXSPECS *idx);
15 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
16
17 /** Crea un nuevo nodo y lo inicializa */
18 NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx) {
19         
20         NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
21         if (nodo == NULL) return NULL;
22         nodo->nivel = 0;
23         nodo->cant_claves = 0;
24
25     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
26         nodo->claves = (int*)malloc(idx->size_claves);
27         nodo->hijos = (int*)malloc(idx->size_hijos);
28         memset(nodo->claves,-1,idx->size_claves);
29         memset(nodo->hijos,-1,idx->size_hijos);
30         
31     return nodo;        
32 }
33
34 /** Crea el archivo indice B+ */
35 int emufs_b_plus_crear(INDEXSPECS *idx) {
36         
37         FILE *fp;
38         NODO_B_PLUS *raiz;
39         int error = 0;
40                 
41         /* Creamos el archivo que contendra el indice */
42         fp = fopen(idx->filename, "w");
43         PERR("Creando indice con nodo raiz");
44         if (fp == NULL) {
45                 PERR("Error al crear el archivo");
46                 return -1;
47         }
48         fclose(fp);
49         
50         /* Creamos el nodo raiz y lo guardamos el en indice */
51         raiz = b_plus_crearnodo(idx);
52         error = b_plus_grabar_nodo(idx,raiz,0);
53         
54         /* Liberamos areas de memoria reservadas */
55         free(raiz->claves);
56         free(raiz->hijos);
57         free(raiz);
58         
59         return error;
60 }
61
62 /* Inserta una nueva clave y reestructura el arbol para que quede como debe */
63 int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query)
64 {
65         NODO_B_PLUS *curnode, *padre;
66         int i,j, prox_nodo = 0;
67         
68         /* Comienzo leyendo la raiz, entry point de toda funcion */
69         curnode = b_plus_leer_nodo(idx,0);      
70         if (curnode == NULL) return -1;
71         padre = curnode;
72         while ( curnode->nivel > 0 && curnode ) {
73                 for(i=0; i<curnode->cant_claves; i++){ 
74                         /* me fijo que si es mayor */
75                         if ( (query->clave.i_clave > curnode->claves[i])) {
76                                 if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
77                                         continue; /*paso a la siguiente*/
78                                 else {  /* si era la ultima, la clave deberia ir ahi */
79                                         /*cargo el proximo nodo*/
80                                         prox_nodo = curnode->hijos[i+1];
81                                         break; /*salgo del for*/
82                                 }
83                         } else {  /*si no es mayor o igual es menor*/
84                                 prox_nodo = curnode->hijos[i];
85                                 break;
86                         }
87                 }
88                 padre = curnode;
89                 curnode = b_plus_leer_nodo(idx, prox_nodo);
90         } 
91         /* aca tengo el nodo donde deberia ir la clave, y su padre */ 
92         
93         if ( curnode->cant_claves < idx->size_claves/sizeof(int) ){
94                 int *claves_aux = (int*)malloc(idx->size_claves);
95                 int *hijos_aux = (int*)malloc(idx->size_hijos);
96                 memset(claves_aux,-1,idx->size_claves);
97                 memset(hijos_aux,-1,idx->size_hijos);
98                 i = 0;
99                 while ( (curnode->claves[i] < query->clave.i_clave) && (i < curnode->cant_claves)){
100                         claves_aux[i] = curnode->claves[i];
101                         hijos_aux[i] = curnode->hijos[i];
102                         i++;
103                 }
104                 curnode->cant_claves++;
105                 claves_aux[i] = query->clave.i_clave;
106                 hijos_aux[i] = query->num_bloque;
107                 for (j=i+1; j<curnode->cant_claves; j++){
108                         claves_aux[j] = curnode->claves[j-1];
109                         hijos_aux[j] = curnode->hijos[j-1];
110                 }
111                 free(curnode->claves);
112                 free(curnode->hijos);
113                 curnode->claves = claves_aux;
114                 curnode->hijos = hijos_aux;
115                 printf ("Prox Nodo es: %i\n",prox_nodo);
116                 b_plus_grabar_nodo(idx, curnode, prox_nodo);
117                 b_plus_destruir_nodo(curnode);
118         }
119                 
120         /* si el nodo esta lleno tengo que splitear */
121         if ( curnode->cant_claves == idx->size_claves ) 
122         {
123                 /**FIXME**/
124         }
125         return 0;
126 }
127
128 /** Busca el nro de bloque donde se debe guardar un reg con clave X.
129  *  Posibilidades: return 0 - Encontro un bloque potencial
130  *                 return -1 - No hay clave, inserto clave de nuevo bloques
131  *                 return 1 - Hubo falla de lectura de un nodo, Abortar
132  */
133 int emufs_b_plus_get_bloque(INDEXSPECS *idx, INDEX_DAT *query, int num_node) {
134
135         NODO_B_PLUS *nodo;
136         nodo = b_plus_leer_nodo(idx,num_node);
137         if (nodo == NULL) return 1;
138         int i = nodo->cant_claves - 1;
139         int exitcode = 0;
140         
141         /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
142         if (nodo->nivel == 0) {
143         /* Vemos en que bloque deberia ir */
144                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) i--;
145                 if (i < 0) {
146                         /* La clave es menor que todas, debo insertarla */
147                         b_plus_destruir_nodo(nodo);                     
148                         emufs_b_plus_insertar(idx,query);                       
149                         return -1;
150                 }
151                 else {
152                         /* Encontre un bloque potencial */
153                         query->num_bloque = nodo->hijos[i];
154                         b_plus_destruir_nodo(nodo);                     
155                         return 0;
156                 }
157         }
158         else {
159                 /* Buscamos por donde descender al siguiente nivel */
160                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) i--;
161         i++;
162         num_node = nodo->hijos[i];
163                 b_plus_destruir_nodo(nodo);
164                 exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
165                 return exitcode;                
166         }
167 }
168
169 NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) {
170
171         /*int i = 0;*/
172         FILE *fp;
173         NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
174         char *disknode = (char*)malloc(idx->tam_bloque);
175         
176         if (num_node < 0) {
177                 PERR("Se intento leer nodo negativo!!\n");
178                 exit(1);
179         }
180         if (disknode == NULL) return NULL;
181         if (memnode == NULL) return NULL;
182         
183     /* Open up file */
184         fp = fopen(idx->filename, "r+");
185         if (fp == NULL) {
186                 free(disknode);
187                 b_plus_destruir_nodo(memnode);
188                 return NULL;
189         }
190
191         /* Intentamos leer un nodo, sino podemos error! */
192         fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
193         if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
194                 free(disknode);
195                 fclose(fp);
196                 return NULL;
197         }
198         fclose(fp);
199         
200         /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
201         memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
202         memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
203         memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
204         free(disknode);
205         
206         /*printf("Dumping Node_%i\n",num_node);
207         printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
208         printf("Claves:");
209         for (i = 0; i < idx->size_claves/sizeof(int); ++i) printf(" %i",memnode->claves[i]);
210         printf("\nHijos:");
211         for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
212         printf("\nEnd Dump\n"); */
213         
214         return memnode;
215         
216 }
217
218 int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node)
219 {
220         FILE *fp;
221         
222         fp = fopen(idx->filename, "r+");
223         if (fp == NULL) return -1;
224                 
225         fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);      
226         fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
227         fwrite(nodo->claves,idx->size_claves,1,fp);
228         fwrite(nodo->hijos,idx->size_hijos,1,fp);
229         fclose(fp);
230         
231         return 0;
232 }
233
234 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
235 {
236         free(nodo->claves);
237         free(nodo->hijos);
238         free(nodo);
239         return 0;
240 }
241
242 int b_plus_split_child(INDEXSPECS *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
243 {
244         /* locals */
245         int minclaves = ceil(idx->size_hijos/sizeof(int)/2)-1;
246         int numbrother,j = 0;
247         int es_interno = 1;
248         
249         NODO_B_PLUS *brother = b_plus_crearnodo(idx);
250         brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
251         
252         /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
253         /* pues el ancla se debe repetir ademas de subir */
254         if (brother->nivel == 0) {
255                 brother->cant_claves = minclaves+1;
256                 es_interno = 0;
257         }
258         else brother->cant_claves = minclaves;
259         
260         /* Copio las claves al brother derecho */
261         for (j = 0; j < brother->cant_claves; ++j)
262                 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
263         
264         /* Copio los hijos ya sea para hoja o no hoja. */
265         for (j = 0; j < brother->cant_claves+1; ++j)
266                 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
267         
268         /* Ahora me ocupo del nodo que se partio */
269         fullnode->cant_claves = minclaves;
270         /* Obtengo numero de nodo para brother y encadeno si es hoja */
271         numbrother = b_plus_get_num_nodo(idx);
272         if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
273         
274         /* Ahora fixeamos el padre, apuntando al nuevo hijo */
275         for (j = parent->cant_claves; j > ithchild; --j)
276                 parent->hijos[j+1] = parent->hijos[j];
277         parent->hijos[ithchild+1] = numbrother;
278         
279         /* Idem pero subo la median key */
280         for (j = parent->cant_claves-1; j >= ithchild; --j)
281                 parent->claves[j+1] = parent->claves[j];
282         parent->claves[ithchild] = fullnode->claves[minclaves];
283         parent->cant_claves++;
284         
285         /* Grabo los nodos en disco */
286         b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
287         b_plus_grabar_nodo(idx,brother,numbrother);
288         b_plus_grabar_nodo(idx,parent,numparent);
289         
290         b_plus_destruir_nodo(brother);
291         
292         return 0;
293 }
294
295
296 int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
297 {
298     int i, num_nodo_hijo;
299     NODO_B_PLUS *hijo;
300     
301     i = nodo->cant_claves-1; 
302     if ( nodo->nivel == 0 ){
303         while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ){
304             nodo->claves[i+1] = nodo->claves[i];
305                         nodo->hijos[i+2] = nodo->hijos[i+1];
306                         nodo->hijos[i+1] = nodo->hijos[i];
307             i--;
308         }
309         nodo->claves[i+1] = query->clave.i_clave;
310                 nodo->hijos[i+1] = query->num_bloque;
311         nodo->cant_claves++;
312         b_plus_grabar_nodo(idx, nodo, num_nodo);
313     } else { 
314         while ( i >= 0 && query->clave.i_clave < nodo->claves[i] ) 
315             i--;
316         i++;
317         num_nodo_hijo = nodo->hijos[i];
318         hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
319         if ( hijo->cant_claves == idx->size_claves/sizeof(int) ) {
320             b_plus_split_child(idx, num_nodo, nodo, i, hijo);
321             if ( query->clave.i_clave > nodo->claves[i] )
322                 i++;
323         }
324                 if (hijo) b_plus_destruir_nodo(hijo);
325                 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
326         b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
327                 if (hijo) b_plus_destruir_nodo(hijo);   
328     }
329         
330         return 0;
331 }    
332
333 int emufs_b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query)
334 {
335     NODO_B_PLUS *raiz;
336     
337     raiz = b_plus_leer_nodo(idx, 0);
338     if ( raiz->cant_claves == idx->size_claves/sizeof(int) ) {
339         NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
340         new_root->nivel = raiz->nivel + 1;
341         new_root->hijos[0] = b_plus_get_num_nodo(idx);
342         b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
343         b_plus_grabar_nodo(idx, new_root, 0);
344             b_plus_split_child(idx, 0, new_root, 0, raiz);
345         b_plus_insert_nonfull(idx, new_root, 0, query);
346                 b_plus_destruir_nodo(new_root);
347     } else 
348         {
349                 b_plus_insert_nonfull(idx, raiz, 0, query);
350         }
351         
352         b_plus_destruir_nodo(raiz);
353     
354     return 0;
355 }
356
357 int b_plus_get_num_nodo(INDEXSPECS *idx)
358 {
359         FILE *fp;
360         int num;
361         
362         fp = fopen(idx->filename, "ab");
363         if (fp == NULL) return -1;
364     
365     num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
366         printf("Num Nodo Nuevo: %i\n",num);
367     fclose(fp);
368     return num;
369 }