X-Git-Url: https://git.llucax.com/z.facultad/75.06/emufs.git/blobdiff_plain/a41bfdd272e2ca232e06677b4e5400e367ba8f81..697b196d3c16efc3fb024a0fba8f49c9c28fb1d0:/emufs/indice_b.c?ds=sidebyside diff --git a/emufs/indice_b.c b/emufs/indice_b.c index 396e9af..89de6e7 100644 --- a/emufs/indice_b.c +++ b/emufs/indice_b.c @@ -1,26 +1,59 @@ #include "indice_b.h" - -#define FILENAME "b.idx" -#define BLOCK_SIZE 512 +#include "common.h" /* Cantidad de claves por nodo */ -#define CANT_HIJOS ((BLOCK_SIZE-sizeof(B_NodoHeader))/sizeof(B_NodoEntry)) -#define CANT_NODOS (CANT_HIJOS+1) -#define MIN_HIJOS (CANT_HIJOS/2) +#define CANT_HIJOS(x) ((x->tam_bloque-sizeof(B_NodoHeader))/sizeof(B_NodoEntry)) +#define CANT_NODOS(x) (CANT_HIJOS(x)+1) +#define MIN_HIJOS(x) (CANT_HIJOS(x)/2) /* Auxiliares */ -static void b_grabar_nodo(int id, char *data); -static int b_ultimo_id(); -static char *b_leer_nodo(int id); -static char *b_crear_nodo(); +/** Graba el nodo en el archivo */ +static void b_grabar_nodo(INDICE *idx, int id, char *data); +/** Da el ID del proximo nodo a poder ser utilizado */ +static int b_ultimo_id(INDICE *idx); +/** Lee un nodo desde el archivo */ +static char *b_leer_nodo(INDICE *idx, int id); +/** Crea un nodo en el archivo y lo retorna. En i se pone el ID asignado */ +static char *b_crear_nodo(INDICE *idx, int *i); +/** Lee el header de un nodo y lo guarda en header */ static void b_leer_header(char *src, B_NodoHeader *header); +/** Actualiza el header de un nodo desde header */ static void b_actualizar_header(char *src, B_NodoHeader *header); +/** Retorna el array de claves del nodo (esta data modifica directamente el bloque + * por eso no es necesario usar un actualizar_claves + */ static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header); -static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo, int hijo1, int hijo2); -const int b_elegir_izquierdo(int a, int b); - -void b_crear() +/** Inserta una clave en el nodo de manera iterativa. + * \param idx Índice en donde insertar la clave. + * \param clave Clave a insertar. + * \param dato Dato a insertar + * \param nodo_id Id del nodo en el cual insertar la nueva clave. + * \param nodo FIXME Nodo en donde insertar??? No entiendo por que char*. + * \param hijo1 Id del nodo hijo de la izquierda del insertado. + * \param hijo2 Id del nodo hijo de la derecha del insertado. + */ +static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2); +/** Inserta en un nodo en el que se sabe positivamente que hay lugar. */ +static void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2); +/** Esto es para asegurar el orden de los hijos luego de partir, en el caso de que + * lo que se parta sea la raiz + */ +static int b_elegir_izquierdo(INDICE *idx, int a, int b); +/** Borra una clave del arbol */ +static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k); +/** Le pide al hermano derecho del nodo una clave cuando se eliminan claves */ +static void b_pedir_clave_derecha(char *, int, char *, int, char *, int, int); +/** Le pide al hermano izquierdo una clave cuando se eliminan claves */ +static void b_pedir_clave_izquierda(char *, int, char *, int, char *, int, int); +/** Le pasa al hermano derecho del nodo una clave cuando se insertan claves */ +static void b_pasar_clave_a_derecha(INDICE*, char*, int, char*, int, int, B_NodoEntry); +/** Le pasa al hermano izquierdo una clave cuando se insertan claves */ +static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_NodoEntry); +/** Junta 2 nodos y hace uno solo */ +static void b_fundir_nodo(char *, int, char *, int, char *, int, int); + +void emufs_indice_b_crear(INDICE *idx) { FILE *fp; char *bloque; @@ -31,19 +64,25 @@ void b_crear() header.padre = -1; header.hijo_izquierdo = -1; - fp = fopen(FILENAME, "w"); + fp = fopen(idx->filename, "w"); + PERR("Creando indice"); + fprintf(stderr, "Archivo = (%s)\n", idx->filename); + if (fp == NULL) { + PERR("Error al crear el archivo"); + return; + } /* Creo el archivo con el Nodo raiz */ - bloque = (char *)malloc(BLOCK_SIZE); - memset(bloque, -1, BLOCK_SIZE); + bloque = (char *)malloc(idx->tam_bloque); + memset(bloque, -1, idx->tam_bloque); memcpy(bloque, &header, sizeof(B_NodoHeader)); - fwrite(bloque, BLOCK_SIZE, 1, fp); + fwrite(bloque, idx->tam_bloque, 1, fp); fclose(fp); } -int b_insertar(int clave, int ubicacion) +int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) { int i, nodo_id, padre_id; B_NodoHeader header; @@ -51,7 +90,7 @@ int b_insertar(int clave, int ubicacion) char *nodo, *padre; /* Leo la raiz */ - nodo = b_leer_nodo(0); + nodo = b_leer_nodo(idx, 0); padre_id = nodo_id = 0; padre = NULL; while (nodo) { @@ -61,27 +100,17 @@ int b_insertar(int clave, int ubicacion) b_leer_header(nodo, &header); claves = b_leer_claves(nodo, &header); i=0; - while ((ifilename, "r"); fseek(fp, 0, SEEK_END); - i = ftell(fp)/BLOCK_SIZE; + i = ftell(fp)/idx->tam_bloque; fclose(fp); return i; } -static char *b_crear_nodo(int *id) +static char *b_crear_nodo(INDICE *idx, int *id) { char *bloque; B_NodoHeader header; - (*id) = b_ultimo_id(); + (*id) = b_ultimo_id(idx); - printf("Nuevo nodo creado : id = %d\n", *id); header.cant = 0; header.nivel = 0; header.hijo_izquierdo = -1; header.padre = -1; - bloque = (char *)malloc(BLOCK_SIZE); - memset(bloque, -1, BLOCK_SIZE); + bloque = (char *)malloc(idx->tam_bloque); + memset(bloque, -1, idx->tam_bloque); memcpy(bloque, &header, sizeof(B_NodoHeader)); - b_grabar_nodo(*id, bloque); + b_grabar_nodo(idx, *id, bloque); return bloque; } -static char *b_leer_nodo(int id) +static char *b_leer_nodo(INDICE *idx, int id) { FILE *fp; char *out; if (id < 0) return NULL; - fp = fopen(FILENAME, "r"); + fp = fopen(idx->filename, "r"); if (fp == NULL) return NULL; - fseek(fp, id*BLOCK_SIZE, SEEK_SET); + fseek(fp, id*idx->tam_bloque, SEEK_SET); - out = (char *)malloc(BLOCK_SIZE); + out = (char *)malloc(idx->tam_bloque); if (out == NULL) { fclose(fp); return NULL; } - if (fread(out, 1, BLOCK_SIZE, fp) != BLOCK_SIZE) { + if (fread(out, 1, idx->tam_bloque, fp) != idx->tam_bloque) { free(out); /* No se puso leer el nodo */ fclose(fp); @@ -191,7 +263,7 @@ static char *b_leer_nodo(int id) return out; } -static void b_grabar_nodo(int id, char *data) +static void b_grabar_nodo(INDICE *idx, int id, char *data) { FILE *fp; @@ -212,9 +284,9 @@ static void b_grabar_nodo(int id, char *data) printf("SOLO GUARDO DATA\n"); }*/ - fp = fopen(FILENAME, "r+"); - fseek(fp, id*BLOCK_SIZE, SEEK_SET); - fwrite(data, 1, BLOCK_SIZE, fp); + fp = fopen(idx->filename, "r+"); + fseek(fp, id*idx->tam_bloque, SEEK_SET); + fwrite(data, 1, idx->tam_bloque, fp); fclose(fp); } @@ -236,7 +308,7 @@ static B_NodoEntry *b_leer_claves(char *src, B_NodoHeader *header) return (B_NodoEntry *)(src+sizeof(B_NodoHeader)); } -static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo, int hijo1, int hijo2) +static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2) { char *padre, *nuevo; int nuevo_id; @@ -249,26 +321,34 @@ static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo do { if (!nodo) { /* CREAR NODO? */ - nodo = b_crear_nodo(&nodo_id); + nodo = b_crear_nodo(idx, &nodo_id); } b_leer_header(nodo, &nodo_header); claves = b_leer_claves(nodo, &nodo_header); - padre = b_leer_nodo(nodo_header.padre); + padre = b_leer_nodo(idx, nodo_header.padre); - if (nodo_header.cant == CANT_HIJOS) { + if (nodo_header.cant == CANT_HIJOS(idx)) { int total; - nuevo = b_crear_nodo(&nuevo_id); + /* TODO: Si es B*, hay que chequear si alguno de los 2 + * nodos hermanos pueden prestarme espacio (y + * desplazar si es así). Si no pueden, hay que + * hacer un split de 2 nodos en 3. + * Si no es B*, hay que hacer lo que sigue: + */ + nuevo = b_crear_nodo(idx, &nuevo_id); i=0; /* Creo una lista ordenada de los nodos a partir */ tmp_claves = (B_NodoEntry *)malloc(sizeof(B_NodoEntry)*(nodo_header.cant+1)); total = nodo_header.cant; - while ((itam_bloque-sizeof(B_NodoHeader)); for(j=0; jtam_bloque-sizeof(B_NodoHeader)); for(j=0; jtam_bloque); free(nodo); nodo = tmp_nuevo; clave = tmp_claves[total/2].clave; - ubicacion = nuevo_id; + /* XXX dato.bloque = nuevo_id; */ - b_grabar_nodo(nuevo_id+1, nodo); - b_grabar_nodo(nuevo_id, nuevo); + b_grabar_nodo(idx, nuevo_id+1, nodo); + b_grabar_nodo(idx, nuevo_id, nuevo); free(nodo); free(nuevo); @@ -331,15 +411,15 @@ static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo hijo2 = nuevo_id; /* Limpio al padre */ - nuevo = b_leer_nodo(0); + nuevo = b_leer_nodo(idx, 0); b_leer_header(nuevo, &nuevo_header); nuevo_header.cant = 0; nuevo_header.padre = -1; nuevo_header.nivel = nodo_header.nivel+1; - memset(nuevo, -1, BLOCK_SIZE); + memset(nuevo, -1, idx->tam_bloque); b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(0, nuevo); + b_grabar_nodo(idx, 0, nuevo); nodo_id = 0; nodo = nuevo; @@ -347,47 +427,60 @@ static void b_insertar_en_nodo(int clave, int ubicacion, int nodo_id, char *nodo } } else { /* La clave entra en este nodo!! */ - i = 0; - if (nodo_header.cant > 0) { - while ((claves[i].clave < clave) && (i < nodo_header.cant)) i++; - for(j=nodo_header.cant; j > i; j--) - claves[j] = claves[j-1]; - } - nodo_header.cant++; - claves[i].clave = clave; - claves[i].ubicacion = ubicacion; - nodo_header.hijo_izquierdo = b_elegir_izquierdo(nodo_header.hijo_izquierdo, hijo1); - - b_actualizar_header(nodo, &nodo_header); - b_grabar_nodo(nodo_id, nodo); - - /* Debo actualizar los punteros al padre de los hijos */ - if (hijo1 != -1) { - nuevo = b_leer_nodo(hijo1); - if (nuevo != NULL) { - b_leer_header(nuevo, &nuevo_header); - nuevo_header.padre = nodo_id; - b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(hijo1, nuevo); - free(nuevo); - } else printf("FUCK! hijo1=%d no existe!\n", hijo1); - } - if (hijo2 != -1) { - nuevo = b_leer_nodo(hijo2); - if (nuevo != NULL) { - b_leer_header(nuevo, &nuevo_header); - nuevo_header.padre = nodo_id; - b_actualizar_header(nuevo, &nuevo_header); - b_grabar_nodo(hijo2, nuevo); - free(nuevo); - } else printf("FUCK! hijo2=%d no existe!\n", hijo2); - } + b_insertar_en_nodo_con_lugar(idx, clave, dato, nodo_id, nodo, hijo1, hijo2); salir = 1; } } while (!salir); } -const int b_elegir_izquierdo(int a, int b) +void b_insertar_en_nodo_con_lugar(INDICE *idx, CLAVE clave, INDICE_DATO dato, int nodo_id, char *nodo, int hijo1, int hijo2) +{ + int i = 0; + B_NodoHeader nodo_header; + B_NodoEntry* claves; + b_leer_header(nodo, &nodo_header); + claves = b_leer_claves(nodo, &nodo_header); + if (nodo_header.cant > 0) { + int j; + while ((emufs_indice_es_menor(idx, claves[i].clave, clave)) && (i < nodo_header.cant)) i++; + for(j=nodo_header.cant; j > i; j--) + claves[j] = claves[j-1]; + } + nodo_header.cant++; + claves[i].clave = clave; + claves[i].dato = dato; + claves[i].hijo_derecho = hijo2; + nodo_header.hijo_izquierdo = b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1); + + b_actualizar_header(nodo, &nodo_header); + b_grabar_nodo(idx, nodo_id, nodo); + + /* Debo actualizar los punteros al padre de los hijos */ + if (hijo1 != -1) { + char* nuevo = b_leer_nodo(idx, hijo1); + if (nuevo != NULL) { + B_NodoHeader nuevo_header; + b_leer_header(nuevo, &nuevo_header); + nuevo_header.padre = nodo_id; + b_actualizar_header(nuevo, &nuevo_header); + b_grabar_nodo(idx, hijo1, nuevo); + free(nuevo); + } else printf("FUCK! hijo1=%d no existe!\n", hijo1); + } + if (hijo2 != -1) { + char* nuevo = b_leer_nodo(idx, hijo2); + if (nuevo != NULL) { + B_NodoHeader nuevo_header; + b_leer_header(nuevo, &nuevo_header); + nuevo_header.padre = nodo_id; + b_actualizar_header(nuevo, &nuevo_header); + b_grabar_nodo(idx, hijo2, nuevo); + free(nuevo); + } else printf("FUCK! hijo2=%d no existe!\n", hijo2); + } +} + +static int b_elegir_izquierdo(INDICE *idx, int a, int b) { int cual; char *nodo1, *nodo2; @@ -397,8 +490,8 @@ const int b_elegir_izquierdo(int a, int b) if (a==-1) return b; if (b==-1) return a; - nodo1 = b_leer_nodo(a); - nodo2 = b_leer_nodo(b); + nodo1 = b_leer_nodo(idx, a); + nodo2 = b_leer_nodo(idx, b); b_leer_header(nodo1, &header1); b_leer_header(nodo2, &header2); @@ -406,7 +499,7 @@ const int b_elegir_izquierdo(int a, int b) claves1 = b_leer_claves(nodo1, &header1); claves2 = b_leer_claves(nodo2, &header2); - if (claves1[0].clave < claves2[0].clave) + if (emufs_indice_es_menor(idx, claves1[0].clave, claves2[0].clave)) cual = a; else cual = b; @@ -416,3 +509,239 @@ const int b_elegir_izquierdo(int a, int b) return cual; } +INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant) +{ + /* Si el indice es primario no tiene sentido hacer nada */ + if (idx->funcion == IND_PRIMARIO) { + *cant = 0; + return NULL; + } + + /* TODO Implementar indices con repeticion */ + return NULL; +} + +static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k) +{ + int pos, actual_id, padre_id, i, pos_padre, izquierda_id, derecha_id; + B_NodoHeader header, header_actual, header_padre, header_izq, header_der; + B_NodoEntry *claves, *claves_actual, *claves_padre;/*, *claves_izq, *claves_der;*/ + char *actual, *padre, *izq, *der; + + b_leer_header(nodo, &header); + claves = b_leer_claves(nodo, &header); + + pos = 0; + /* Busco la posicion dentro de la lista de claves */ + while (emufs_indice_es_menor(idx, claves[pos].clave, k)) pos++; + + /* Es el nodo una hoja? */ + if (header.hijo_izquierdo != -1) { + /* No!, es un nodo intermedio!! */ + if (pos == 0) + actual = b_leer_nodo(idx, header.hijo_izquierdo); + else + actual = b_leer_nodo(idx, claves[pos+1].hijo_derecho); + + b_leer_header(actual, &header_actual); + while (header_actual.hijo_izquierdo != -1) { + actual_id = header_actual.hijo_izquierdo; + free(actual); + actual = b_leer_nodo(idx, actual_id); + b_leer_header(actual, &header_actual); + } + claves_actual = b_leer_claves(actual, &header); + + claves[pos] = claves_actual[0]; + pos = 0; + b_grabar_nodo(idx, nodo_id, nodo); + } else { + actual = nodo; + } + + /* Borro la clave */ + for(i=pos; i < header_actual.cant; i++) { + claves_actual[i] = claves_actual[i+1]; + } + header_actual.cant--; + /* Guardo los cambios */ + b_actualizar_header(actual, &header_actual); + b_grabar_nodo(idx, actual_id, actual); + + /* Se cumple la condicion de hijos? */ + if (header_actual.cant >= MIN_HIJOS(idx)) { + PERR("Borrar completo sin fundir"); + return; + } + + /* Tengo que pasar datos o fundir nodos :-( */ + do { + padre_id = header.padre; + padre = b_leer_nodo(idx, padre_id); + b_leer_header(padre, &header_padre); + claves_padre = b_leer_claves(padre, &header_padre); + /* TODO Tengo el hijo_izquierdo para revisar!! XXX */ + if (header_padre.hijo_izquierdo == actual_id) { + izquierda_id = -1; /* No tengo hermano izquierdo */ + /* Mi hermano derecho es el primer nodo del padre */ + derecha_id = claves_padre[0].hijo_derecho; + der = b_leer_nodo(idx, derecha_id); + b_leer_header(der, &header_der); + } else { + for(pos_padre=0; claves_padre[pos_padre].hijo_derecho != actual_id; pos_padre++) { } + + /* Busco mis hermanos a derecha e izquierda, si es que existen */ + if (pos_padre >= 0) { + if (pos_padre == 0) + izquierda_id = header_padre.hijo_izquierdo; + else + izquierda_id = claves_padre[pos_padre-1].hijo_derecho; + izq = b_leer_nodo(idx, izquierda_id); + b_leer_header(izq, &header_izq); + } else { + izquierda_id = -1; + } + if (pos_padre < header_padre.cant) { + derecha_id = claves_padre[pos_padre+1].hijo_derecho; + der = b_leer_nodo(idx, derecha_id); + b_leer_header(der, &header_der); + } else { + derecha_id = -1; + } + } + /* Intendo pasar una clave desde un hermano hacia mi */ + if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) { + b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre); + } else if ((izquierda_id != -1) && (header_izq.cant > MIN_HIJOS(idx))) { + b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1); + } else { + /* No pude pasar clave, tengo que fundir :-( */ + if (derecha_id != -1) { + b_fundir_nodo(actual, actual_id, padre, padre_id, der, derecha_id, pos_padre); + } else { + b_fundir_nodo(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre-1); + } + } + + /* TODO que guardo ?, todo ? */ + b_grabar_nodo(idx, actual_id, actual); + b_grabar_nodo(idx, izquierda_id, izq); + b_grabar_nodo(idx, derecha_id, der); + b_grabar_nodo(idx, padre_id, padre); + if (actual_id != -1) free(actual); + /*if (padre_id != -1) free(padre);*/ + if (derecha_id != -1) free(der); + if (izquierda_id != -1) free(izq); + actual = padre; + actual_id = padre_id; + } while ((actual_id != -1) && (header_actual.cant < MIN_HIJOS(idx))); +} + +static void b_pedir_clave_derecha(char *der, int der_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave) +{ + int i; + B_NodoHeader h_der, h_padre, h_nodo; + B_NodoEntry *c_der, *c_padre, *c_nodo; + + b_leer_header(nodo, &h_nodo); + c_nodo = b_leer_claves(nodo, &h_nodo); + b_leer_header(der, &h_der); + c_der = b_leer_claves(der, &h_der); + b_leer_header(padre, &h_padre); + c_padre = b_leer_claves(padre, &h_padre); + + c_nodo[h_nodo.cant] = c_padre[pos_clave]; + c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */ + + c_padre[pos_clave] = c_der[0]; + c_padre[pos_clave].hijo_derecho = der_id; + + /* Muevo las claves de derecho */ + for(i=0; i0;i++) + c_nodo[i] = c_nodo[i-1]; + + h_nodo.cant++; + c_nodo[0] = c_padre[pos_clave]; + c_nodo[0].hijo_derecho = -1; /* XXX */ + c_padre[pos_clave] = c_izq[h_izq.cant-1]; + c_padre[pos_clave].hijo_derecho = izq_id; + h_izq.cant--; + + b_actualizar_header(izq, &h_izq); + b_actualizar_header(padre, &h_padre); + b_actualizar_header(nodo, &h_nodo); +} + +void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry) +{ +/* int i; + B_NodoHeader h_izq, h_padre, h_nodo; + B_NodoEntry *c_izq, *c_padre, *c_nodo; + + b_leer_header(nodo, &h_nodo); + c_nodo = b_leer_claves(nodo, &h_nodo); + b_leer_header(izq, &h_izq); + c_izq = b_leer_claves(izq, &h_izq); + b_leer_header(padre, &h_padre); + c_padre = b_leer_claves(padre, &h_padre); + + for(i=h_nodo.cant; i>0;i++) + c_nodo[i] = c_nodo[i-1]; + + h_nodo.cant++; + c_nodo[0] = c_padre[pos_clave]; + c_nodo[0].hijo_derecho = -1; / * XXX * / + c_padre[pos_clave] = c_izq[h_izq.cant-1]; + c_padre[pos_clave].hijo_derecho = izq_id; + h_izq.cant--; + + b_actualizar_header(izq, &h_izq); + b_actualizar_header(padre, &h_padre); + b_actualizar_header(nodo, &h_nodo); +*/ +} + +static void b_fundir_nodo(char *izq, int izq_id, char *padre, int padre_id, char *der, int der_id, int pos_clave) +{ +} +