]> git.llucax.com Git - z.facultad/75.06/emufs.git/blob - emufs/b_plus.c
Se agrega SPLIT_CHILD para redondear el insertar
[z.facultad/75.06/emufs.git] / emufs / b_plus.c
1 /** Arbol B+ */
2 #include "b_plus.h"
3
4 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
5 /* numerando los bloques */
6 int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node);
7 /*NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node);*/
8 NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 /*int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query);*/
11 int b_plus_split_child(INDEXSPECS *idx, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
12 int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
13 int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query);
14 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
15
16 /** Crea un nuevo nodo y lo inicializa */
17 NODO_B_PLUS *b_plus_crearnodo(INDEXSPECS *idx) {
18         
19         NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
20         if (nodo == NULL) return NULL;
21         nodo->nivel = 0;
22         nodo->cant_claves = 0;
23
24     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
25         nodo->claves = (int*)malloc(idx->size_claves);
26         nodo->hijos = (int*)malloc(idx->size_hijos);
27         memset(nodo->claves,-1,idx->size_claves);
28         memset(nodo->hijos,-1,idx->size_hijos);
29         
30     return nodo;        
31 }
32
33 /** Crea el archivo indice B+ */
34 int emufs_b_plus_crear(INDEXSPECS *idx) {
35         
36         FILE *fp;
37         NODO_B_PLUS *raiz;
38         int error = 0;
39                 
40         /* Creamos el archivo que contendra el indice */
41         fp = fopen(idx->filename, "w");
42         PERR("Creando indice con nodo raiz");
43         if (fp == NULL) {
44                 PERR("Error al crear el archivo");
45                 return -1;
46         }
47         fclose(fp);
48         
49         /* Creamos el nodo raiz y lo guardamos el en indice */
50         raiz = b_plus_crearnodo(idx);
51         error = b_plus_grabar_nodo(idx,raiz,0);
52         
53         /* Liberamos areas de memoria reservadas */
54         free(raiz->claves);
55         free(raiz->hijos);
56         free(raiz);
57         
58         return error;
59 }
60
61 /* Inserta una nueva clave y reestructura el arbol para que quede como debe */
62 int b_plus_insertar_clave(INDEXSPECS *idx, INDEX_DAT *query)
63 {
64         NODO_B_PLUS *curnode, *padre, *new_nodo;
65         int i,j, prox_nodo;
66         /* Comienzo leyendo la raiz, entry point de toda funcion */
67         curnode = b_plus_leer_nodo(idx,0);      
68         if (curnode == NULL) return -1;
69         padre = curnode;
70         while ( curnode->nivel > 0 && curnode ) {
71                 for(i=0; i<curnode->cant_claves; i++){ 
72                         /* me fijo que si es mayor */
73                         if ( (query->clave.i_clave > curnode->claves[i])) {
74                                 if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
75                                         continue; /*paso a la siguiente*/
76                                 else {  /* si era la ultima, la clave deberia ir ahi */
77                                         /*cargo el proximo nodo*/
78                                         prox_nodo = curnode->hijos[i+1];
79                                         break; /*salgo del for*/
80                                 }
81                         } else {  /*si no es mayor o igual es menor*/
82                                 prox_nodo = curnode->hijos[i];
83                                 break;
84                         }
85                 }
86                 padre = curnode;
87                 curnode = b_plus_leer_nodo(idx, prox_nodo);
88         } 
89         /* aca tengo el nodo donde deberia ir la clave, y su padre */ 
90         
91         if ( curnode->cant_claves < idx->size_claves/sizeof(int) ){
92                 int *claves_aux = (int*)malloc(idx->size_claves);
93                 int *hijos_aux = (int*)malloc(idx->size_hijos);
94                 memset(claves_aux,-1,idx->size_claves);
95                 memset(hijos_aux,-1,idx->size_hijos);
96                 i = 0;
97                 while ( (curnode->claves[i] < query->clave.i_clave) && (i < curnode->cant_claves)){
98                         claves_aux[i] = curnode->claves[i];
99                         hijos_aux[i] = curnode->hijos[i];
100                         i++;
101                 }
102                 curnode->cant_claves++;
103                 claves_aux[i] = query->clave.i_clave;
104                 hijos_aux[i] = query->num_bloque;
105                 for (j=i+1; j<curnode->cant_claves; j++){
106                         claves_aux[j] = curnode->claves[j-1];
107                         hijos_aux[j] = curnode->hijos[j-1];
108                 }
109                 free(curnode->claves);
110                 free(curnode->hijos);
111                 curnode->claves = claves_aux;
112                 curnode->hijos = hijos_aux;
113                 b_plus_grabar_nodo(idx, curnode, prox_nodo);
114                 b_plus_destruir_nodo(curnode);
115         }
116                 
117         /* si el nodo esta lleno tengo que splitear */
118         if ( curnode->cant_claves == idx->size_claves ) 
119         {
120                 /**FIXME**/
121         }
122         return 0;
123 }
124
125 /** Busca el nro de bloque donde se debe guardar un reg con clave X */
126 /** Si la clave entra en la raiz, la guarda, si no, busca el nodo hoja
127     donde debe ir y devuelve el bloque (en query) pero no graba la clave */
128 /** Devuelve -1 si no hay un bloque donde insertar la nueva clave */
129 int emufs_b_plus_get_bloque(INDEXSPECS *idx, INDEX_DAT *query) {
130
131     NODO_B_PLUS *curnode;
132         int i, prox_nodo;
133         /* Comienzo leyendo la raiz, entry point de toda funcion */
134         printf ("Buscando donde insertar clave: %i\n\n",query->clave.i_clave);
135         curnode = b_plus_leer_nodo(idx,0);      
136         if (curnode == NULL) return -1;
137         /* Me fijo si la raiz esta vacia */
138         if ( curnode->cant_claves == 0 ){ /* entra la clave en la raiz */ 
139                 /* ojo que este es un caso muy particular */
140                 /* aumento la cant de claves*/
141                 curnode->cant_claves++;
142                 /* inserto la clave en el nodo, como es la primera no hace falta ordenar nada*/
143                 *(curnode->claves) = query->clave.i_clave;
144                 /* En query->num_bloque viene un numero de bloque nuevo valido..*/
145                 /* Le asigno al nodo del arbol el mismo numero que venia en query*/
146                 *(curnode->hijos) = query->num_bloque;
147                 /* Cargado el query salgo de la func, luego habra que actualizar el .dat */
148                 /*grabo el nodo en el archivo*/
149                 b_plus_grabar_nodo(idx, curnode, 0);
150                 /* librero el nodo */
151                 b_plus_destruir_nodo(curnode);
152                 return 0;
153         } 
154         PERR("TENGO LA HOJA");  
155         /* Mientras no encontre la hoja con la clave, busco.. */
156         /* RECORDAR QUE LAS CLAVES DEBEN ESTAR ORDENADAS PARA QUE ESTO FUNCIONE !! */ 
157         while (curnode->nivel > 0 && curnode){  
158                 /*recorro las claves hasta encontrar la primera mayor a la que quiero insertar*/
159                 for(i=0; i<curnode->cant_claves; i++){ 
160                         /* me fijo que si es mayor */
161                         if ( (query->clave.i_clave > curnode->claves[i])) {
162                                 if ( curnode->cant_claves != i ) /* si no es la ultima clave del nodo */
163                                         continue; /*paso a la siguiente*/
164                                 else {  /* si era la ultima, la clave deberia ir ahi */
165                                         /*cargo el proximo nodo*/
166                                         prox_nodo = curnode->hijos[i+1];
167                                         break; /*salgo del for*/
168                                 }
169                         } else {  /*si no es mayor o igual es menor*/
170                                 prox_nodo = curnode->hijos[i];
171                                 break;
172                         }
173                 }
174                 b_plus_destruir_nodo(curnode);
175                 curnode = b_plus_leer_nodo(idx, prox_nodo);
176         } 
177         
178         /*cuando salgo de aca deberia tener cargado en curnode el nodo hoja que busque*/
179         for (i=0; i<curnode->cant_claves-1; i++){
180                 if ( query->clave.i_clave >= curnode->claves[i] ){
181                         if ( curnode->cant_claves != i ) /* si no es la ultima clave */
182                                 continue;
183                         else {   /* si era la ultima */
184                                 /* Cargo en query el numero del bloque donde deberia ir la nueva clave */
185                                 query->num_bloque = curnode->hijos[i];
186                                 b_plus_destruir_nodo(curnode);
187                                 return 0;
188                         }
189                 } else {  /* si no era mayor, era menor */
190                         if ( i == 0 ){ 
191                                                                 
192                                 /* ACA PODRIAMOS RETORNAR -1 COMO CODIGO DE ERROR QUE INFORMARIA QUE NO EXISTE 
193                                    UN NODO DONDE QUEPA LA CLAVE, ENTONCES HABRIA QUE LLAMAR A LA FUNCION QUE
194                                    ACTUALIZA EL ARBOL Y SE ENCARGA DE ARGREGAR LA CLAVE Y HACER EL SPLIT DE SER 
195                                    NECESARIO */
196                                 /* Llamo a la funcion que mete una clave nueva en el arbol y le paso el bloque a donde 
197                                    tiene que apuntar */
198                                 b_plus_insertar_clave(idx, query);
199                                 b_plus_destruir_nodo(curnode);
200                                 return 1; /* SE INSERTO NODO NUEVO */
201                         } else {
202                                 query->num_bloque = curnode->hijos[i-1];
203                                 b_plus_destruir_nodo(curnode);
204                                 return 0;
205                         }
206                 }
207         }
208
209         if (curnode) b_plus_destruir_nodo(curnode);
210         return 0;
211 }
212
213 NODO_B_PLUS *b_plus_leer_nodo(INDEXSPECS *idx, int num_node) {
214
215         int i = 0;
216         FILE *fp;
217         NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
218         char *disknode = (char*)malloc(idx->tam_bloque);
219         
220         if (disknode == NULL) return NULL;
221         if (memnode == NULL) return NULL;
222         
223     /* Open up file */
224         fp = fopen(idx->filename, "r+");
225         if (fp == NULL) {
226                 free(disknode);
227                 b_plus_destruir_nodo(memnode);
228                 return NULL;
229         }
230
231         /* Intentamos leer un nodo, sino podemos error! */
232         fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
233         if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
234                 free(disknode);
235                 fclose(fp);
236                 return NULL;
237         }
238         fclose(fp);
239         
240         /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
241         memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
242         memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
243         memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
244         free(disknode);
245         
246         printf("Dumping Node_%i\n",num_node);
247         printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
248         printf("Claves:");
249         for (i = 0; i < idx->size_claves/sizeof(int); ++i) printf(" %i",memnode->claves[i]);
250         printf("\nHijos:");
251         for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
252         printf("\nEnd Dump\n"); 
253         
254         return memnode;
255         
256 }
257
258 int b_plus_grabar_nodo(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_node)
259 {
260         FILE *fp;
261         
262         fp = fopen(idx->filename, "r+");
263         if (fp == NULL) return -1;
264                 
265         fseek(fp,num_node*sizeof(NODO_B_PLUS),SEEK_SET);        
266         fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
267         fwrite(nodo->claves,idx->size_claves,1,fp);
268         fwrite(nodo->hijos,idx->size_hijos,1,fp);
269         fclose(fp);
270         
271         return 0;
272 }
273
274 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
275 {
276         free(nodo->claves);
277         free(nodo->hijos);
278         free(nodo);
279         return 0;
280 }
281
282 int b_plus_split_child(INDEXSPECS *idx, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
283 {
284         /* locals */
285         int minclaves = ceil(idx->size_hijos/sizeof(int)/2)-1;
286         int j = 0;
287         int es_interno = 1;
288         
289         NODO_B_PLUS *brother = b_plus_crearnodo(idx);
290         brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
291         
292         /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
293         /* pues el ancla se debe repetir ademas de subir */
294         if (brother->nivel == 0) {
295                 brother->cant_claves = minclaves+1;
296                 es_interno = 0;
297         }
298         else brother->cant_claves = minclaves;
299         
300         /* Copio las claves al brother derecho */
301         for (j = 0; j < brother->cant_claves; ++j)
302                 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
303         
304         /* Copio los hijos ya sea para hoja o no hoja. Copia Chain Also! */
305         for (j = 0; j < brother->cant_claves+1; ++j)
306                 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
307         
308         /* Ahora me ocupo del nodo que se partio */
309         fullnode->cant_claves = minclaves;
310         /* Obtengo numero de nodo para brother, para encadenar */
311         numbrother = b_plus_get_num_nodo(idx);
312         fullnode->hijos[idx->cant_claves+1] = numbrother;
313         
314         /* Ahora fixeamos el padre, apuntando al nuevo hijo */
315         for (j = parent->cant_claves; j > ithchild; --j)
316                 parent->hijos[j+1] = parent->hijos[j];
317         parent->hijos[ithchild+1] = numbrother;
318         
319         /* Idem pero subo la median key */
320         for (j = parent->cant_claves-1; j >= ithchild; --j)
321                 parent->claves[j+1] = parent->claves[j];
322         parent->claves[ithchild] = fullnode->claves[minclaves];
323 }
324
325
326 int b_plus_insert_nonfull(INDEXSPECS *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
327 {
328     int i, num_nodo_hijo;
329     NODO_B_PLUS *hijo;
330     
331     i = nodo->cant_claves;
332     if ( nodo->nivel == 0 ){
333         while ( i >= 1 && query->clave.i_clave < nodo->claves[i] ){
334             nodo->claves[i+1] = nodo->claves[i];
335             i--;
336         }
337         nodo->claves[i+1] = query->clave.i_clave;
338         nodo->cant_claves++;
339         b_plus_destruir_nodo(nodo);
340         b_plus_grabar_nodo(idx, nodo, num_nodo);
341     } else { 
342         while ( i >= 1 && query->clave.i_clave < nodo->claves[i] ) 
343             i--;
344         i++;
345         num_nodo_hijo = nodo->hijos[i-1];
346         hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
347         if ( hijo->cant_claves == idx->size_claves/sizeof(int) ) {
348             b_plus_split_child(idx, nodo, i, hijo);
349             if ( query->clave.i_clave > nodo->claves[i] )
350                 i++;
351         }
352         b_plus_insert_nonfull(idx, hijo, num_nodo_hijo, query);
353     }
354     b_plus_destruir_nodo(hijo);
355     return 0;
356 }    
357
358 int b_plus_insertar(INDEXSPECS *idx, INDEX_DAT *query)
359 {
360     NODO_B_PLUS *raiz;
361     
362     raiz = b_plus_leer_nodo(idx, 0);
363     if ( raiz->cant_claves == idx->size_claves/sizeof(int) ) {
364         NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
365         new_root->nivel = raiz->nivel + 1;
366         new_root->hijos[0] = b_plus_get_num_nodo(idx);
367         b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
368         b_plus_grabar_nodo(idx, new_root, 0);
369         b_plus_split_child(idx, new_root, 1, raiz);
370         b_plus_insert_nonfull(idx, new_root, 0, query);
371     } else b_plus_insert_nonfull(idx, raiz, 0, query);
372     
373     return 0;
374 }
375
376 int b_plus_split_child(INDEXSPECS *idx, NODO_B_PLUS *new_root, int i, NODO_B_PLUS* raiz)
377 {
378     return 0;
379 }
380
381 int b_plus_get_num_nodo(INDEXSPECS *idx)
382 {
383         FILE *fp;
384         int num;
385         
386         fp = fopen(idx->filename, "r+");
387         if (fp == NULL) return -1;
388     
389     num = ftell(fp)/sizeof(NODO_B_PLUS);
390     fclose(fp);
391     return num;
392 }