]> git.llucax.com Git - z.facultad/75.06/emufs.git/blob - emufs/indice_bplus.c
si esto llega a andar me como una cebolla cruda
[z.facultad/75.06/emufs.git] / emufs / indice_bplus.c
1 /** Arbol B+ */
2 #include "indices.h"
3 #include "indice_bplus.h"
4
5 /**#*#*#*#*#**#*#*#*#*#* Private prototypes*#*#*#*#*#**#*#*#*#*#**#*#*#*/
6 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node);
7 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node);
8 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx);
9 int b_plus_destruir_nodo(NODO_B_PLUS *nodo);
10 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode);
11 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query);
12 int b_plus_insertar(INDICE *idx, INDEX_DAT *query);
13 int b_plus_get_num_nodo(INDICE *idx);
14 /**#*#*#*#*#**#*#*#*#*#*FIN PROTOTYPES*#*#*#*#*#**#*#*#*#*#**#*#*#*#*#*/
15
16 /** Crea un nuevo nodo y lo inicializa */
17 NODO_B_PLUS *b_plus_crearnodo(INDICE *idx) {
18         
19         NODO_B_PLUS *nodo = (NODO_B_PLUS*)malloc(sizeof(NODO_B_PLUS));
20         if (nodo == NULL) return NULL;
21         nodo->nivel = 0;
22         nodo->cant_claves = 0;
23
24     /* Calculamos lo que ocupan las cadenas de bytes claves + hijos */
25         nodo->claves = (CLAVE*)malloc(idx->size_claves);
26         nodo->hijos = (int*)malloc(idx->size_hijos);
27         memset(nodo->claves,-1,idx->size_claves);
28         memset(nodo->hijos,-1,idx->size_hijos);
29         
30     return nodo;        
31 }
32
33 /** Crea el archivo indice B+ */
34 int emufs_b_plus_crear(INDICE *idx) {
35         
36         FILE *fp;
37         NODO_B_PLUS *raiz;
38         int error = 0;
39                 
40         /* Creamos el archivo que contendra el indice */
41         fp = fopen(idx->filename, "w");
42         PERR("Creando indice con nodo raiz");
43         if (fp == NULL) {
44                 PERR("Error al crear el archivo");
45                 return -1;
46         }
47         fclose(fp);
48         
49         /* Creamos el nodo raiz y lo guardamos el en indice */
50         raiz = b_plus_crearnodo(idx);
51         error = b_plus_grabar_nodo(idx,raiz,0);
52         
53         /* Liberamos areas de memoria reservadas */
54         free(raiz->claves);
55         free(raiz->hijos);
56         free(raiz);
57         
58         return error;
59 }
60
61
62 /** Busca el nro de bloque donde se debe guardar un reg con clave X.
63  *  Posibilidades: return 0 - Encontro un bloque potencial
64  *                 return -1 - No hay clave, inserto clave de nuevo bloques
65  *                 return 1 - Hubo falla de lectura de un nodo, Abortar
66  */
67 int emufs_b_plus_get_bloque(INDICE *idx, INDEX_DAT *query, int num_node) {
68
69         NODO_B_PLUS *nodo;
70         nodo = b_plus_leer_nodo(idx,num_node);
71         if (nodo == NULL) return 1;
72         int i = nodo->cant_claves - 1;
73         int exitcode = 0;
74         
75         /* Si es un hoja, busco dentro de la hoja, otherwise, busco la hoja */
76         if (nodo->nivel == 0) {
77         /* Vemos en que bloque deberia ir */
78                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
79                 if (i < 0) {
80                         /* La clave es menor que todas, debo insertarla */
81                         b_plus_destruir_nodo(nodo);                     
82                         emufs_b_plus_insertar(idx,query);                       
83                         return -1;
84                 }
85                 else {
86                         /* Encontre un bloque potencial */
87                         query->num_bloque = nodo->hijos[i];
88                         b_plus_destruir_nodo(nodo);                     
89                         return 0;
90                 }
91         }
92         else {
93                 /* Buscamos por donde descender al siguiente nivel */
94                 while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) i--;
95         i++;
96         num_node = nodo->hijos[i];
97                 b_plus_destruir_nodo(nodo);
98                 exitcode = emufs_b_plus_get_bloque(idx,query,num_node);
99                 return exitcode;                
100         }
101 }
102
103 NODO_B_PLUS *b_plus_leer_nodo(INDICE *idx, int num_node) {
104
105         /*int i = 0;*/
106         FILE *fp;
107         NODO_B_PLUS *memnode = b_plus_crearnodo(idx);   
108         char *disknode = (char*)malloc(idx->tam_bloque);
109         
110         if (num_node < 0) {
111                 PERR("Se intento leer nodo negativo!!\n");
112                 exit(1);
113         }
114         if (disknode == NULL) return NULL;
115         if (memnode == NULL) return NULL;
116         
117     /* Open up file */
118         fp = fopen(idx->filename, "r+");
119         if (fp == NULL) {
120                 free(disknode);
121                 b_plus_destruir_nodo(memnode);
122                 return NULL;
123         }
124
125         /* Intentamos leer un nodo, sino podemos error! */
126         fseek(fp, num_node*idx->tam_bloque, SEEK_SET);
127         if (fread(disknode, idx->tam_bloque, 1, fp) != 1) {
128                 free(disknode);
129                 fclose(fp);
130                 return NULL;
131         }
132         fclose(fp);
133         
134         /* Pudimos leer un nodo de disco, ahora lo transformamos a nodo mem */
135         memcpy(memnode,disknode,SIZE_B_PLUS_HEADER);
136         memcpy(memnode->claves,disknode+SIZE_B_PLUS_HEADER,idx->size_claves);
137         memcpy(memnode->hijos,disknode+SIZE_B_PLUS_HEADER+idx->size_claves,idx->size_hijos);
138         free(disknode);
139         
140         /*printf("Dumping Node_%i\n",num_node);
141         printf("Nivel: %i  Cant Claves: %i\n",memnode->nivel,memnode->cant_claves);
142         printf("Claves:");
143         for (i = 0; i < idx->size_claves/sizeof(CLAVE); ++i) printf(" %i",memnode->claves[i].i_clave);
144         printf("\nHijos:");
145         for (i = 0; i < idx->size_hijos/sizeof(int); ++i) printf(" %i",memnode->hijos[i]);
146         printf("\nEnd Dump\n"); */
147         
148         return memnode;
149         
150 }
151
152 int b_plus_grabar_nodo(INDICE *idx, NODO_B_PLUS *nodo, int num_node)
153 {
154         FILE *fp;
155         
156         fp = fopen(idx->filename, "r+");
157         if (fp == NULL) return -1;
158                 
159         fseek(fp,num_node*(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos),SEEK_SET);      
160         fwrite(nodo,SIZE_B_PLUS_HEADER,1,fp);
161         fwrite(nodo->claves,idx->size_claves,1,fp);
162         fwrite(nodo->hijos,idx->size_hijos,1,fp);
163         fclose(fp);
164         
165         return 0;
166 }
167
168 int b_plus_destruir_nodo(NODO_B_PLUS *nodo)
169 {
170         free(nodo->claves);
171         free(nodo->hijos);
172         free(nodo);
173         return 0;
174 }
175
176 int b_plus_split_child(INDICE *idx, int numparent, NODO_B_PLUS *parent, int ithchild, NODO_B_PLUS *fullnode)
177 {
178         /* locals */
179         int minclaves = ceil(idx->size_hijos/sizeof(int)/2)-1;
180         int numbrother,j = 0;
181         int es_interno = 1;
182         
183         NODO_B_PLUS *brother = b_plus_crearnodo(idx);
184         brother->nivel = fullnode->nivel; /* Idem nivel que el que se parte */
185         
186         /* Si estoy en una hoja, la parte derecha del partido tendra minclaves+1 */
187         /* pues el ancla se debe repetir ademas de subir */
188         if (brother->nivel == 0) {
189                 brother->cant_claves = minclaves+1;
190                 es_interno = 0;
191         }
192         else brother->cant_claves = minclaves;
193         
194         /* Copio las claves al brother derecho */
195         for (j = 0; j < brother->cant_claves; ++j)
196                 brother->claves[j] = fullnode->claves[j+minclaves+es_interno];
197         
198         /* Copio los hijos ya sea para hoja o no hoja. */
199         for (j = 0; j < brother->cant_claves+1; ++j)
200                 brother->hijos[j] = fullnode->hijos[j+minclaves+es_interno];
201         
202         /* Ahora me ocupo del nodo que se partio */
203         fullnode->cant_claves = minclaves;
204         /* Obtengo numero de nodo para brother y encadeno si es hoja */
205         numbrother = b_plus_get_num_nodo(idx);
206         if (fullnode->nivel == 0) fullnode->hijos[minclaves] = numbrother;
207         
208         /* Ahora fixeamos el padre, apuntando al nuevo hijo */
209         for (j = parent->cant_claves; j > ithchild; --j)
210                 parent->hijos[j+1] = parent->hijos[j];
211         parent->hijos[ithchild+1] = numbrother;
212         
213         /* Idem pero subo la median key */
214         for (j = parent->cant_claves-1; j >= ithchild; --j)
215                 parent->claves[j+1] = parent->claves[j];
216         parent->claves[ithchild] = fullnode->claves[minclaves];
217         parent->cant_claves++;
218         
219         /* Grabo los nodos en disco */
220         b_plus_grabar_nodo(idx,fullnode,parent->hijos[ithchild]);
221         b_plus_grabar_nodo(idx,brother,numbrother);
222         b_plus_grabar_nodo(idx,parent,numparent);
223         
224         b_plus_destruir_nodo(brother);
225         
226         return 0;
227 }
228
229
230 int b_plus_insert_nonfull(INDICE *idx, NODO_B_PLUS *nodo, int num_nodo, INDEX_DAT *query)
231 {
232     int i, num_nodo_hijo;
233     NODO_B_PLUS *hijo;
234     
235     i = nodo->cant_claves-1; 
236     if ( nodo->nivel == 0 ){
237         while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ){
238             nodo->claves[i+1] = nodo->claves[i];
239                         nodo->hijos[i+2] = nodo->hijos[i+1];
240                         nodo->hijos[i+1] = nodo->hijos[i];
241             i--;
242         }
243         nodo->claves[i+1] = query->clave;
244                 nodo->hijos[i+1] = query->num_bloque;
245         nodo->cant_claves++;
246         b_plus_grabar_nodo(idx, nodo, num_nodo);
247     } else { 
248         while ( i >= 0 && query->clave.i_clave < nodo->claves[i].i_clave ) 
249             i--;
250         i++;
251         num_nodo_hijo = nodo->hijos[i];
252         hijo = b_plus_leer_nodo(idx, num_nodo_hijo);
253         if ( hijo->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
254             b_plus_split_child(idx, num_nodo, nodo, i, hijo);
255             if ( query->clave.i_clave > nodo->claves[i].i_clave )
256                 i++;
257         }
258                 if (hijo) b_plus_destruir_nodo(hijo);
259                 hijo = b_plus_leer_nodo(idx, nodo->hijos[i]);
260         b_plus_insert_nonfull(idx, hijo, nodo->hijos[i], query);
261                 if (hijo) b_plus_destruir_nodo(hijo);   
262     }
263         
264         return 0;
265 }    
266
267 int emufs_b_plus_insertar(INDICE *idx, INDEX_DAT *query)
268 {
269     NODO_B_PLUS *raiz;
270     
271     raiz = b_plus_leer_nodo(idx, 0);
272     if ( raiz->cant_claves == idx->size_claves/sizeof(CLAVE) ) {
273         NODO_B_PLUS *new_root = b_plus_crearnodo(idx);
274         new_root->nivel = raiz->nivel + 1;
275         new_root->hijos[0] = b_plus_get_num_nodo(idx);
276         b_plus_grabar_nodo(idx, raiz, new_root->hijos[0]);
277         b_plus_grabar_nodo(idx, new_root, 0);
278             b_plus_split_child(idx, 0, new_root, 0, raiz);
279         b_plus_insert_nonfull(idx, new_root, 0, query);
280                 b_plus_destruir_nodo(new_root);
281     } else 
282         {
283                 b_plus_insert_nonfull(idx, raiz, 0, query);
284         }
285         
286         b_plus_destruir_nodo(raiz);
287     
288     return 0;
289 }
290
291 int b_plus_get_num_nodo(INDICE *idx)
292 {
293         FILE *fp;
294         int num;
295         
296         fp = fopen(idx->filename, "ab");
297         if (fp == NULL) return -1;
298     
299     num = ftell(fp)/(SIZE_B_PLUS_HEADER+idx->size_claves+idx->size_hijos);
300         printf("Num Nodo Nuevo: %i\n",num);
301     fclose(fp);
302     return num;
303 }