]> git.llucax.com Git - z.facultad/75.52/treemulator.git/blob - src/btree.cpp
Bugfix : Condición base para cortar la recursividad.
[z.facultad/75.52/treemulator.git] / src / btree.cpp
1
2 #include "btree.h"
3
4 BTree::BTree (const std::string &name, unsigned int block_size, int kt, bool create_new_file)
5 {
6         key_type = kt;
7         uchar *node;
8         BTreeNodeHeader nh;
9
10         fp = fopen (name.c_str(), "wb+");
11         if (!fp) {
12                 /* TODO : mandar una exception ? */
13                 return;
14         }
15
16         /* Nombre de archivo */
17         filename = name;
18         
19         /* Inicializo el header */
20         header.block_size = block_size;
21         WriteFileHeader ();
22
23         /* Creo el primer bloque vacio */
24         node = new uchar[block_size];
25         ReadNodoHeader (node, &nh);
26         nh.level = 0;
27         nh.free_space = block_size - sizeof (BTreeNodeHeader);
28         nh.item_count = 0;
29         WriteNodoHeader (node, &nh);
30         WriteBlock (node, 0);
31
32         delete [] node;
33 }
34
35 BTree::~BTree ()
36 {
37         fclose (fp);
38 }
39
40 void BTree::WriteFileHeader ()
41 {
42         fseek (fp, 0L, SEEK_SET);
43         fwrite (&header, 1, sizeof (BTreeFileHeader), fp);
44 }
45
46 void BTree::WriteBlock (uchar *block, uint num)
47 {
48         num++;
49         fseek (fp, num*header.block_size, SEEK_SET);
50         fwrite (block, 1, header.block_size, fp);
51 }
52
53 void BTree::AddKey (const Clave &k)
54 {
55         uint left, right;
56         Clave *kout = AddKeyR (k.Clone (), 0, left, right);
57
58         if (kout) {
59                 unsigned short level;
60                 /* Debo dejar la raiz en el nodo 0, por lo que paso el nodo
61                  * que esta usando el hijo izquierdo a un nuevo nodo */
62                 std::list<BTreeData *> node_keys;
63                 BTreeNodeHeader node_header;
64                 uchar *node = ReadBlock (left);
65                 ReadNodoHeader (node, &node_header);
66                 node_keys = ReadKeys (node, node_header);
67                 level = node_header.level + 1;
68
69                 uchar *new_node = NewBlock (left);
70                 delete [] new_node; /* No me interesa, voy a usar lo leio antes */
71                 
72                 WriteKeys (node, node_header, node_keys);
73                 WriteNodoHeader (node, &node_header);
74                 WriteBlock (node, left);
75                 DeleteKeys (node_keys);
76                 delete [] node;
77
78                 /* Leo y actualizo la Raiz */
79                 node = ReadBlock (0);
80                 ReadNodoHeader (node, &node_header);
81                 node_keys = std::list<BTreeData *>();
82
83                 node_keys.push_back (new BTreeChildData (left));
84                 node_keys.push_back (new BTreeData (kout, right));
85
86                 node_header.level = level;
87                 node_header.item_count = 1;
88
89                 WriteKeys (node, node_header, node_keys);
90                 WriteNodoHeader (node, &node_header);
91                 WriteBlock (node, 0);
92                 delete [] node;
93                 DeleteKeys (node_keys);
94                 PrintNode (0);
95         }
96 }
97
98 Clave* BTree::AddKeyR (const Clave *k, uint node_num, uint &left_child, uint &right_child)
99 {
100         uchar *node = ReadBlock (node_num);
101         BTreeNodeHeader node_header;
102         ReadNodoHeader (node, &node_header);
103         delete [] node;
104
105         if (node_header.level == 0)
106                 return AddKeyLeafR (k, node_num, left_child, right_child);
107
108         return AddKeyOtherR (k, node_num, left_child, right_child);
109 }
110
111 Clave* BTree::AddKeyLeafR (const Clave *k, uint node_num, uint &left_child, uint &right_child)
112 {
113         Clave *kout = NULL;
114         std::list<BTreeData *> node_keys;
115
116         BTreeData *data = new BTreeLeafData (k->Clone ());
117
118         /* Leo el nodo raiz para empezar a agregar */
119         uchar *node = ReadBlock (node_num);
120         BTreeNodeHeader node_header;
121         ReadNodoHeader (node, &node_header);
122
123         if (node_header.free_space > data->Size ()) {
124                 BTreeData *datait;
125                 node_keys = ReadKeys (node, node_header);
126                 std::list<BTreeData *>::iterator it = node_keys.begin ();
127
128                 while (it != node_keys.end ()) {
129                         datait = (*it);
130                         if ((*data) < (*datait))
131                                 /* Me pase, lo agrego aca! */
132                                 break;
133                         it++;
134                 }
135                 node_keys.insert (it, data);
136                 WriteKeys (node, node_header, node_keys);
137                 WriteNodoHeader (node, &node_header);
138                 WriteBlock (node, node_num);
139                 DeleteKeys (node_keys);
140                 delete [] node;
141
142                 PrintNode (node_num);
143         } else {
144                 /* Split : Creo e inicializo el nuevo nodo */
145                 std::list<BTreeData *> new_node_keys;
146                 std::list<BTreeData *> old_node_keys;
147                 BTreeNodeHeader new_node_header;
148                 uint new_node_num;
149                 uchar *new_node = NewBlock (new_node_num);
150                 ReadNodoHeader (new_node, &new_node_header);
151                 new_node_header.level = node_header.level;
152
153                 node_keys = ReadKeys (node, node_header);
154                 new_node_keys = ReadKeys (new_node, new_node_header);
155
156                 /* Agrego la clave en la lista que ya tengo de manera ordenada */
157                 std::list<BTreeData *>::iterator it = node_keys.begin ();
158                 std::list<BTreeData *>::iterator previt = node_keys.begin ();
159
160                 while (it != node_keys.end ()) {
161                         BTreeData *datait;
162                         datait = (*it);
163                         if ((*data) < (*datait))
164                                 /* Me pase, lo agrego aca! */
165                                 break;
166                         previt = it;
167                         it++;
168                 }
169                 if (it != node_keys.end ())
170                         node_keys.insert (it, data);
171                 else
172                         node_keys.push_back (data);
173
174                 /* Tengo que guardar claves hasta ocupar nodo size/2 en cada nodo
175                  * y subir la clave del medio */
176                 node_header.item_count = 0;
177                 node_header.free_space = header.block_size - sizeof (BTreeNodeHeader);
178
179                 uint total_size = 0;
180                 it = node_keys.begin ();
181                 while (it != node_keys.end ()) {
182                         BTreeData *datait;
183                         datait = (*it);
184                         total_size += datait->Size ();
185                         it++;
186                         /* Hack : Si me quedo con todas las claves, en el caso de ser
187                          * del mismo tama#o se desbalancea. Hay que ver que efecto 
188                          * puede tener en el caso de claves de long. variable
189                          */
190                         if (it == node_keys.end ())
191                                 total_size -= datait->Size ();
192                 }
193
194                 it = node_keys.begin ();
195                 uint used = 0;
196                 while (used < total_size/2) {
197                         BTreeData *d = (*it);
198                         old_node_keys.push_back (d);
199                         used += d->Size ();
200                         it++;
201                 }
202                 kout = (*it++)->getClave (); // Esta se retorna al "padre" para que se la agregue
203
204                 while (it != node_keys.end ()) {
205                         BTreeData *d = (*it);
206                         new_node_keys.push_back (d);
207                         it++;
208                 }
209         
210                 /* Guardo */
211                 WriteKeys (node, node_header, old_node_keys);
212                 WriteNodoHeader (node, &node_header);
213                 WriteBlock (node, node_num);
214                 WriteKeys (new_node, new_node_header, new_node_keys);
215                 WriteNodoHeader (new_node, &new_node_header);
216                 WriteBlock (new_node, new_node_num);
217                 DeleteKeys (old_node_keys);
218                 DeleteKeys (new_node_keys);
219
220                 PrintNode (node_num);
221                 PrintNode (new_node_num);
222
223                 /* Paso los hijos */
224                 left_child = node_num;
225                 right_child = new_node_num;
226                 delete [] new_node;
227                 delete [] node;
228         }
229
230         return kout;
231 }
232
233 Clave* BTree::AddKeyOtherR (const Clave *k, uint node_num, uint &left_child, uint &right_child)
234 {
235         Clave *kout = NULL;
236         std::list<BTreeData *> node_keys;
237
238         BTreeData *data = new BTreeLeafData (k->Clone ());
239
240         /* Leo el nodo raiz para empezar a agregar */
241         uchar *node = ReadBlock (node_num);
242         BTreeNodeHeader node_header;
243         ReadNodoHeader (node, &node_header);
244
245         node_keys = ReadKeys (node, node_header);
246
247         std::list<BTreeData *>::iterator it = node_keys.begin ();
248         std::list<BTreeData *>::iterator posterior;
249         std::list<BTreeData *>::iterator ultima;
250         
251         /* Se supone que la primera es un hijo :) */
252         BTreeData *lchild = (*it++);
253         posterior = it;
254
255         while (it != node_keys.end ()) {
256                 if ((*data) < (*(*it)))
257                         break;
258                 ultima = it;
259                 it++;
260         }
261
262         if (it == posterior) {
263                 k = AddKeyR (k, lchild->getChild (), left_child, right_child);
264         } else {
265                 k = AddKeyR (k, (*ultima)->getChild (), left_child, right_child);
266         }
267         DeleteKeys (node_keys);
268
269         /* Nada que hacer */
270         if (data) delete data;
271         if (!k) {
272                 delete [] node;
273                 return NULL;
274         }
275
276         data = new BTreeData (k->Clone (), right_child);
277
278         if (node_header.free_space > data->Size ()) {
279                 BTreeData *datait;
280                 node_keys = ReadKeys (node, node_header);
281                 std::list<BTreeData *>::iterator it = node_keys.begin ();
282
283                 while (it != node_keys.end ()) {
284                         datait = (*it);
285                         if ((*data) < (*datait))
286                                 /* Me pase, lo agrego aca! */
287                                 break;
288                         it++;
289                 }
290                 node_keys.insert (it, data);
291                 WriteKeys (node, node_header, node_keys);
292                 WriteNodoHeader (node, &node_header);
293                 WriteBlock (node, node_num);
294                 DeleteKeys (node_keys);
295                 delete [] node;
296
297                 PrintNode (node_num);
298         } else {
299                 /* Split : Creo e inicializo el nuevo nodo */
300                 std::list<BTreeData *> new_node_keys;
301                 std::list<BTreeData *> old_node_keys;
302                 BTreeNodeHeader new_node_header;
303                 uint new_node_num;
304                 uchar *new_node = NewBlock (new_node_num);
305                 ReadNodoHeader (new_node, &new_node_header);
306                 new_node_header.level = node_header.level;
307
308                 node_keys = ReadKeys (node, node_header);
309                 new_node_keys = ReadKeys (new_node, new_node_header);
310
311                 /* Agrego la clave en la lista que ya tengo de manera ordenada */
312                 std::list<BTreeData *>::iterator it = node_keys.begin ();
313                 std::list<BTreeData *>::iterator previt = node_keys.begin ();
314
315                 previt = ++it;
316         
317                 while (it != node_keys.end ()) {
318                         BTreeData *datait;
319                         datait = (*it);
320                         if ((*data) < (*datait))
321                                 /* Me pase, lo agrego aca! */
322                                 break;
323                         previt = it;
324                         it++;
325                 }
326                 if (it != node_keys.end ())
327                         node_keys.insert (it, data);
328                 else
329                         node_keys.push_back (data);
330
331                 /* Tengo que guardar claves hasta ocupar nodo size/2 en cada nodo
332                  * y subir la clave del medio */
333                 node_header.item_count = 0;
334                 node_header.free_space = header.block_size - sizeof (BTreeNodeHeader);
335
336                 uint total_size = 0;
337                 it = node_keys.begin ();
338                 while (it != node_keys.end ()) {
339                         BTreeData *datait;
340                         datait = (*it);
341                         total_size += datait->Size ();
342                         it++;
343                         /* Hack : Si me quedo con todas las claves, en el caso de ser
344                          * del mismo tama#o se desbalancea. Hay que ver que efecto 
345                          * puede tener en el caso de claves de long. variable
346                          */
347                         if (it == node_keys.end ())
348                                 total_size -= datait->Size ();
349                 }
350
351                 it = node_keys.begin ();
352                 uint used = 0;
353                 while (used < total_size/2) {
354                         BTreeData *d = (*it);
355                         old_node_keys.push_back (d);
356                         used += d->Size ();
357                         it++;
358                 }
359                 kout = (*it)->getClave (); // Esta se retorna al "padre" para que se la agregue
360
361                 new_node_keys.push_back ( new BTreeChildData ((*it)->getChild ()));
362                 it++;
363                 while (it != node_keys.end ()) {
364                         BTreeData *d = (*it);
365                         new_node_keys.push_back (d);
366                         it++;
367                 }
368         
369                 /* Guardo */
370                 WriteKeys (node, node_header, old_node_keys);
371                 WriteNodoHeader (node, &node_header);
372                 WriteBlock (node, node_num);
373                 WriteKeys (new_node, new_node_header, new_node_keys);
374                 WriteNodoHeader (new_node, &new_node_header);
375                 WriteBlock (new_node, new_node_num);
376                 DeleteKeys (old_node_keys);
377                 DeleteKeys (new_node_keys);
378
379                 PrintNode (node_num);
380                 PrintNode (new_node_num);
381
382                 /* Paso los hijos */
383                 left_child = node_num;
384                 right_child = new_node_num;
385                 delete [] new_node;
386                 delete [] node;
387         }
388
389         return kout;
390 }
391
392 void BTree::DelKey (const Clave &k) {}
393
394 void BTree::ReadNodoHeader (uchar *node, BTreeNodeHeader *header)
395 {
396         memcpy (header, node, sizeof (BTreeNodeHeader));
397 }
398
399 void BTree::WriteNodoHeader (uchar *node, BTreeNodeHeader *header)
400 {
401         memcpy (node, header, sizeof (BTreeNodeHeader));
402 }
403
404 uchar *BTree::ReadBlock (uint num)
405 {
406         /* Como el bloque 0 se usa para el header, el Nodo "num"
407          * está en el bloque "num+1"
408          */
409         num++;
410
411         uchar *out = new uchar[header.block_size];
412
413         fseek (fp, num*header.block_size, SEEK_SET);    
414         fread (out, 1, header.block_size, fp);
415
416         return out;
417 }
418
419 std::list<BTreeData *> BTree::ReadKeys (uchar *node, BTreeNodeHeader &node_header)
420 {
421         std::list<BTreeData *> keys;
422         node += sizeof (BTreeNodeHeader);
423         uint count = node_header.item_count;
424
425         if (node_header.item_count == 0) return keys;
426
427         if (node_header.level != 0) {
428                 /* Si no es una hoja, lo primero que tengo es un BTreeChildData */
429                 BTreeChildData *d = new BTreeChildData (node);
430                 node += d->Size ();
431                 keys.push_back (d);
432                 count--;
433         }
434
435         for (uint i=0; i<count; i++) {
436                 /* TODO : El tipo de clave deberia ser usado 
437                  * dependiendo de algun dato en el header del
438                  * arbol
439                  */
440                 /* TODO : Detectar si estoy en una hoja */
441                 BTreeData *data;
442                 if (node_header.level == 0) {
443                         data = new BTreeLeafData (node, key_type);
444                 } else {
445                         data = new BTreeData (node, key_type);
446                 }
447                 node += data->Size ();
448                 keys.push_back (data);
449         }
450
451         return keys;
452 }
453
454 void BTree::WriteKeys (uchar *node, BTreeNodeHeader &node_header, std::list<BTreeData *> &keys)
455 {
456         std::list<BTreeData *>::iterator it = keys.begin ();
457
458         node += sizeof (BTreeNodeHeader);
459
460         node_header.item_count = 0;
461         node_header.free_space = header.block_size - sizeof (BTreeNodeHeader);
462
463         while (it != keys.end ()) {
464                 BTreeData *d = (*it);
465                 uchar *n = d->ToArray ();
466                 memcpy (node, n, d->Size ());
467                 delete [] n;
468                 node += d->Size ();
469                 node_header.free_space -= d->Size ();
470                 node_header.item_count++;
471                 it++;
472         }
473
474         /* TODO : incrementar node_header.item_count aca o fuera de este metodo? */
475 }
476                 
477 void BTree::PrintNode (uint num)
478 {
479         uchar *node = ReadBlock (num);
480         BTreeNodeHeader node_header;
481         ReadNodoHeader (node, &node_header);
482                 
483         std::list<BTreeData *> node_keys = ReadKeys (node, node_header);
484         std::list<BTreeData *>::iterator it = node_keys.begin ();
485
486         std::cout << "Nodo  : " << num << std::endl;
487         std::cout << "Level : " << node_header.level << std::endl;
488         std::cout << "Items : " << node_header.item_count << std::endl;
489         std::cout << "Free  : " << node_header.free_space << " (" << (header.block_size - sizeof (BTreeNodeHeader)) << ")" << std::endl;
490         while (it != node_keys.end ()) {
491                 std::string s = *(*it);
492                 std::cout << s << " "; 
493                 it++;
494         }
495         std::cout << std::endl;
496
497         delete [] node;
498         DeleteKeys (node_keys);
499 }
500
501 uchar *BTree::NewBlock (uint &num)
502 {
503         long filelen;
504         uchar *node;
505         BTreeNodeHeader nh;
506
507         fseek (fp, 0, SEEK_END);
508         filelen = ftell (fp);
509
510         num = filelen/header.block_size - 1;
511
512         node = new uchar[header.block_size];
513         ReadNodoHeader (node, &nh);
514         nh.level = 0;
515         nh.free_space = header.block_size - sizeof (BTreeNodeHeader);
516         nh.item_count = 0;
517         WriteNodoHeader (node, &nh);
518         WriteBlock (node, num);
519
520         return node;
521 }
522
523 bool BTree::FindKey (const Clave &k)
524 {
525         return FindKeyR (&k, 0);
526 }
527
528 bool BTree::FindKeyR (const Clave *k, uint node_num)
529 {
530         std::list<BTreeData *> node_keys;
531         BTreeNodeHeader node_header;
532
533         /* Leo el nodo raiz para empezar a agregar */
534         uchar *node = ReadBlock (node_num);
535         ReadNodoHeader (node, &node_header);
536         node_keys = ReadKeys (node, node_header);
537
538         std::list<BTreeData *>::iterator it = node_keys.begin ();
539         std::list<BTreeData *>::iterator posterior;
540         std::list<BTreeData *>::iterator ultima;
541         
542         /* Se supone que la primera es un hijo :) */
543         BTreeData *lchild;
544         if (node_header.level != 0) {
545                 lchild = (*it++);
546         }
547         posterior = it;
548
549         BTreeData *data;
550         if (node_header.level == 0)
551                 data = new BTreeLeafData ((Clave *)k);
552         else
553                 data = new BTreeData ((Clave *)k, 0);
554
555         while (it != node_keys.end ()) {
556                 if ((*data) == (*(*it))) {
557                         /* La encontre!, retorno */
558                         delete [] node;
559                         DeleteKeys (node_keys);
560                         return true;
561                 }
562
563                 if ((*data) < (*(*it)))
564                         break;
565                 ultima = it;
566                 it++;
567         }
568
569         /* TODO: Aca faltaria liberar memoria */
570         if (it == posterior)
571                 return FindKeyR (k, lchild->getChild ());
572                 
573         return FindKeyR (k, (*ultima)->getChild ());
574 }
575
576 void BTree::DeleteKeys (std::list<BTreeData *> &keys)
577 {
578         std::list<BTreeData *>::iterator it = keys.begin ();
579
580         while (it != keys.end ()) {
581                 BTreeData *d = (*it);
582                 delete d;
583                 it++;
584         }
585 }
586