#include "indice_b.h"
#include "common.h"
+#include "emufs.h"
/* Cantidad de claves por nodo */
#define CANT_HIJOS(x) ((x->tam_bloque-sizeof(B_NodoHeader))/sizeof(B_NodoEntry))
/** Le pide al hermano izquierdo una clave cuando se eliminan claves */
static void b_pedir_clave_izquierda(char *, int, char *, int, char *, int, int);
/** Le pasa al hermano derecho del nodo una clave cuando se insertan claves */
-static void b_pasar_clave_a_derecha(char *, int, char *, int, char *, int, int);
+static void b_pasar_clave_a_derecha(INDICE*, char*, int, char*, int, int, B_NodoEntry);
/** Le pasa al hermano izquierdo una clave cuando se insertan claves */
-static void b_pasar_clave_a_izquierda(char *, int, char *, int, char *, int, int);
+static void b_pasar_clave_a_izquierda(INDICE*, char*, int, char*, int, int, B_NodoEntry);
/** Junta 2 nodos y hace uno solo */
static void b_fundir_nodo(char *, int, char *, int, char *, int, int);
+
+static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo);
+
+static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
+static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
void emufs_indice_b_crear(INDICE *idx)
{
header.hijo_izquierdo = -1;
fp = fopen(idx->filename, "w");
- PERR("Creando indice");
- fprintf(stderr, "Archivo = (%s)\n", idx->filename);
if (fp == NULL) {
PERR("Error al crear el archivo");
return;
B_NodoHeader header;
B_NodoEntry *claves;
char *nodo, *padre;
+ INDICE_DATO dummy;
/* Leo la raiz */
nodo = b_leer_nodo(idx, 0);
i=0;
while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++;
if ((i<header.cant) && (emufs_indice_es_igual(idx, claves[i].clave, clave))) {
- /* CLAVE DUPLICADA! */
- return 0;
+ if (idx->funcion == IND_PRIMARIO) {
+ PERR("Indice primario no puede contener claves duplicadas!");
+ PERR(idx->nombre);
+ return 0;
+ }
+
+ /* TODO : Implementar carga de valor en clave duplicada! */
+ b_insertar_dup_en_pos(idx, claves[i].dato, dato);
+
+ if (idx->tipo_dato == IDX_STRING) {
+ /* Tengo que sacar el texto repetido del archivo de textos */
+ idx->emu_string->borrar_registro(idx->emu_string, clave);
+ }
+ return 1;
} else {
if (i == 0) {
nodo = b_leer_nodo(idx, header.hijo_izquierdo);
if (nodo) free(nodo);
nodo = padre;
nodo_id = padre_id;
+
+ if (idx->funcion != IND_PRIMARIO) {
+ /* Agrego el DATO real al archivo de claves repetiras
+ * y me guardo el ID para poner en el indice
+ */
+ dummy.id = -1;
+ dato.id = b_insertar_dup_en_pos(idx, dummy, dato);
+ }
+
b_insertar_en_nodo(idx, clave, dato, nodo_id, nodo, -1, -1);
return 1; /* Agregar OK! */
}
B_NodoHeader header;
B_NodoEntry *claves;
char *nodo, *tmp;
+ int nodo_id;
/* Leo la raiz */
nodo = b_leer_nodo(idx, 0);
+ nodo_id = 0;
while (nodo) {
b_leer_header(nodo, &header);
claves = b_leer_claves(nodo, &header);
i=0;
while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++;
- if (emufs_indice_es_igual(idx, claves[i].clave, clave)) {
+ if ((i<header.cant) && (emufs_indice_es_igual(idx, claves[i].clave, clave))) {
ret = claves[i].dato;
+ b_grabar_nodo(idx, nodo_id, nodo);
free(nodo);
return ret;
} else {
tmp = nodo;
+ b_grabar_nodo(idx, nodo_id, nodo);
if (i == 0) {
nodo = b_leer_nodo(idx, header.hijo_izquierdo);
+ nodo_id = header.hijo_izquierdo;
} else {
nodo = b_leer_nodo(idx, claves[i-1].hijo_derecho);
+ nodo_id = claves[i-1].hijo_derecho;
}
free(tmp);
}
nodo_id = 0; /* Tomo la raiz */
nodo = b_leer_nodo(idx, nodo_id);
- PERR("Buscando clave a borrar");
while (nodo && !encontrado) {
/* Obtengo los datos del nodo */
b_leer_header(nodo, &header);
{
FILE *fp;
char *out;
+ B_NodoHeader header;
+ B_NodoEntry *claves;
if (id < 0) return NULL;
return NULL;
}
+ /* Si estoy manejando string tengo que sacar las abreviaturas */
+ if (idx->tipo_dato == IDX_STRING) {
+ b_leer_header(out, &header);
+ claves = b_leer_claves(out, &header);
+ desabreviar_claves(idx, claves, &header);
+ }
fclose(fp);
return out;
}
static void b_grabar_nodo(INDICE *idx, int id, char *data)
{
FILE *fp;
+ B_NodoHeader header;
+ B_NodoEntry *claves;
-/* if (id > b_ultimo_id()) {
- printf("AGREGANDO AL FINAL\n");
- fp = fopen(FILENAME, "a");
- if (fp == NULL) {
- _("No se pudo abrir archivo\n");
- return;
- }
- } else {
- fp = fopen(FILENAME, "w");
- if (fp == NULL) {
- _("No se pudo abrir archivo\n");
- return;
- }
- fseek(fp, id*BLOCK_SIZE, SEEK_SET);
- printf("SOLO GUARDO DATA\n");
- }*/
-
+ /* Si las claves son de tipo string debo abreviar antes de guardar */
+ if (idx->tipo_dato == IDX_STRING) {
+ b_leer_header(data, &header);
+ claves = b_leer_claves(data, &header);
+ abreviar_claves(idx, claves, &header);
+ }
fp = fopen(idx->filename, "r+");
fseek(fp, id*idx->tam_bloque, SEEK_SET);
fwrite(data, 1, idx->tam_bloque, fp);
i=0;
/* Creo una lista ordenada de los nodos a partir */
tmp_claves = (B_NodoEntry *)malloc(sizeof(B_NodoEntry)*(nodo_header.cant+1));
- total = nodo_header.cant;
+ total = nodo_header.cant+1;
while ((i<nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) {
tmp_claves[i] = claves[i];
i++;
}
tmp_claves[i].clave = clave;
tmp_claves[i].dato = dato;
- tmp_claves[i].hijo_derecho = hijo1;
- tmp_claves[i+1].hijo_derecho = hijo2;
+ /*tmp_claves[i].hijo_derecho = hijo1;*/
+ if (i==0) {
+ nodo_header.hijo_izquierdo = hijo1;
+ tmp_claves[i].hijo_derecho = hijo2;
+ } else {
+ tmp_claves[i-1].hijo_derecho = hijo1;
+ tmp_claves[i].hijo_derecho = hijo2;
+ }
+/* if (i == 0)
+ nodo_header.hijo_izquierdo = hijo2;
+ else
+ tmp_claves[i+1].hijo_derecho = hijo2;*/
while (i < nodo_header.cant) {
tmp_claves[i+1] = claves[i];
i++;
b_leer_header(nuevo, &nuevo_header);
nuevo_header.nivel = nodo_header.nivel;
- nodo_header.cant = total/2;
- nuevo_header.cant = total - nodo_header.cant;
+ nodo_header.cant = total/2-1;
+ nuevo_header.cant = (total-1) - nodo_header.cant;
memset(claves, '*', idx->tam_bloque-sizeof(B_NodoHeader));
for(j=0; j<nodo_header.cant; j++)
claves_nuevo = b_leer_claves(nuevo, &nuevo_header);
memset(claves_nuevo, '*', idx->tam_bloque-sizeof(B_NodoHeader));
for(j=0; j<nuevo_header.cant; j++)
- claves_nuevo[j] = tmp_claves[j+total/2+1];
+ claves_nuevo[j] = tmp_claves[j+total/2];
b_actualizar_header(nodo, &nodo_header);
b_actualizar_header(nuevo, &nuevo_header);
if (nodo_id != 0) {
clave = tmp_claves[total/2].clave;
- /* XXX dato.bloque = nuevo_id; */
+ dato = tmp_claves[total/2].dato;
b_grabar_nodo(idx, nodo_id, nodo);
b_grabar_nodo(idx, nuevo_id, nuevo);
nodo = tmp_nuevo;
clave = tmp_claves[total/2].clave;
- /* XXX dato.bloque = nuevo_id; */
+ dato = tmp_claves[total/2].dato;
b_grabar_nodo(idx, nuevo_id+1, nodo);
b_grabar_nodo(idx, nuevo_id, nuevo);
claves = b_leer_claves(nodo, &nodo_header);
if (nodo_header.cant > 0) {
int j;
- while ((emufs_indice_es_menor(idx, claves[i].clave, clave)) && (i < nodo_header.cant)) i++;
+ while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++;
for(j=nodo_header.cant; j > i; j--)
claves[j] = claves[j-1];
}
nodo_header.cant++;
claves[i].clave = clave;
claves[i].dato = dato;
- claves[i].hijo_derecho = hijo2;
- nodo_header.hijo_izquierdo = b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);
+ if (i==0) {
+ nodo_header.hijo_izquierdo = hijo1;
+ claves[i].hijo_derecho = hijo2;
+ } else {
+ claves[i-1].hijo_derecho = hijo1;
+ claves[i].hijo_derecho = hijo2;
+ }
+ /*b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);*/
b_actualizar_header(nodo, &nodo_header);
b_grabar_nodo(idx, nodo_id, nodo);
INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant)
{
+ EMUFS_REG_SIZE tam;
+ int error=0;
+ char *leido;
+ CLAVE k;
+ INDICE_DATO dato, *ret;
+
/* Si el indice es primario no tiene sentido hacer nada */
if (idx->funcion == IND_PRIMARIO) {
*cant = 0;
+ PERR("INDICE PRIMARIO NO SOPORTA BUSQUEDA MULTIPLE");
return NULL;
}
- /* TODO Implementar indices con repeticion */
- return NULL;
+ /* Busco la clave en el arbol */
+ dato = emufs_indice_b_buscar(idx, clave);
+
+ if (dato.id == -1) {
+ PERR("CLAvE NO ENCONTRADA EN EL ARBOL!");
+ }
+
+ /* Leo el contenido actual */
+ k.i_clave = dato.id;
+ error = 0;
+ leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error);
+
+ /* Incremento en 1 la cantidad */
+ if (leido != NULL)
+ (*cant) = *((int *)leido);
+ else
+ (*cant) = 0;
+
+ ret = malloc(sizeof(INDICE_DATO)*(*cant));
+ memcpy(ret, leido+sizeof(int), (*cant)*sizeof(INDICE_DATO));
+ free(leido);
+ return ret;
}
static void b_borrar_clave(INDICE *idx, char *nodo, int nodo_id, CLAVE k)
b_actualizar_header(nodo, &h_nodo);
}
-static void b_pasar_clave_a_derecha(char *der, int der_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+void b_pasar_clave_a_derecha(INDICE *idx, char *der, int der_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry)
{
-/* int i;
- B_NodoHeader h_der, h_padre, h_nodo;
- B_NodoEntry *c_der, *c_padre, *c_nodo;
-
- b_leer_header(nodo, &h_nodo);
- c_nodo = b_leer_claves(nodo, &h_nodo);
- b_leer_header(der, &h_der);
- c_der = b_leer_claves(der, &h_der);
- b_leer_header(padre, &h_padre);
- c_padre = b_leer_claves(padre, &h_padre);
-
- c_nodo[h_nodo.cant] = c_padre[pos_clave];
- c_nodo[h_nodo.cant].hijo_derecho = -1; / * XXX * /
-
- c_padre[pos_clave] = c_der[0];
- c_padre[pos_clave].hijo_derecho = der_id;
-
- / * Muevo las claves de derecho * /
- for(i=0; i<h_der.cant; i++) {
- c_der[i] = c_der[i+1];
- }
- h_der.cant++;
-
- b_actualizar_header(der, &h_der);
- b_actualizar_header(nodo, &h_nodo);
-*/
+ B_NodoHeader der_h, padre_h;
+ B_NodoEntry *der_entries, *padre_entries;
+ /* Leo claves y cabecera del nodo de la derecha y del padre */
+ b_leer_header(der, &der_h);
+ der_entries = b_leer_claves(der, &der_h);
+ b_leer_header(padre, &padre_h);
+ padre_entries = b_leer_claves(padre, &padre_h);
+ /* Inserto en el hijo derecho la clave del padre */
+ b_insertar_en_nodo_con_lugar(idx, padre_entries[padre_pos].clave, padre_entries[padre_pos].dato,
+ der_id, der, entry.hijo_derecho, der_h.hijo_izquierdo);
+ /* Reemplazo clave del padre por clave nueva */
+ entry.hijo_derecho = der_id;
+ padre_entries[padre_pos] = entry;
}
-static void b_pedir_clave_izquierda(char *izq, int izq_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+void b_pedir_clave_izquierda(char *izq, int izq_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
{
int i;
B_NodoHeader h_izq, h_padre, h_nodo;
b_actualizar_header(nodo, &h_nodo);
}
-static void b_pasar_clave_a_izquierda(char *izq, int izq_id, char *padre, int padre_id, char *nodo, int nodo_id, int pos_clave)
+void b_pasar_clave_a_izquierda(INDICE* idx, char *izq, int izq_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry)
{
/* int i;
B_NodoHeader h_izq, h_padre, h_nodo;
{
}
+static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo)
+{
+ int cant;
+ EMUFS_REG_SIZE tam;
+ int error=0;
+ INDICE_DATO *array;
+ char *leido;
+ CLAVE k;
+
+ /* Leo el contenido actual */
+ k.i_clave = pos.id;
+ error = 0;
+ leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error);
+
+ /* Incremento en 1 la cantidad */
+ if (leido != NULL)
+ cant = *((int *)leido);
+ else
+ cant = 0;
+ cant++;
+
+ /* Obtengo un nuevo lugar para el dato nuevo */
+ /* Aca todo bien, si leido es NULL se compota como malloc */
+ leido = realloc(leido, cant*sizeof(INDICE_DATO)+sizeof(int));
+ array = (INDICE_DATO *)(leido+sizeof(int));
+
+ /* Pongo el dato nuevo */
+ array[cant-1] = nuevo;
+
+ /* Actualizo la cantidad */
+ (*((int *)leido)) = cant;
+
+ /* Salvo */
+ if (k.i_clave == -1) {
+ /* Creo uno nuevo */
+ error = 0;
+ k.i_clave = idx->emu_mult->grabar_registro(idx->emu_mult,
+ leido,
+ cant*sizeof(INDICE_DATO)+sizeof(int),
+ &error
+ );
+ if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!");
+ } else {
+ /* Modifico el que ya existia! */
+ error = 0;
+ idx->emu_mult->modificar_registro(idx->emu_mult,
+ k.i_clave,
+ leido,
+ cant*sizeof(INDICE_DATO)+sizeof(int),
+ &error
+ );
+ }
+ /* Clean up! */
+ free(leido);
+ return k.i_clave;
+}
+
+char *abreviar(char *primera, char *actual, int *iguales)
+{
+ (*iguales) = 0;
+ while (((*primera) != '\0') && ((*actual) != '\0')) {
+ if ((*primera) == (*actual)) {
+ primera++;
+ actual++;
+ (*iguales)++;
+ } else {
+ /* No coinciden mas! */
+ break;
+ }
+ }
+
+ return actual;
+}
+
+static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header)
+{
+ char *primera, *actual, *resto, salvar[100];
+ EMUFS_REG_SIZE size;
+ int error, i;
+ int iguales;
+
+ /* Agarro la primer clave entera como referencia */
+ primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error);
+ for(i=1; i<header->cant; i++) {
+ actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error);
+ if (*actual == '*') {
+ free(actual);
+ continue;
+ }
+ resto = abreviar(primera, actual, &iguales);
+ /* Para que tenga sentido abreviar tengo que tener
+ * mas de 2 letras iguales, si no no gano nada y complica las cosas
+ */
+ if (iguales > 1) {
+ sprintf(salvar, "%d|%s", iguales, resto);
+ free(actual);
+ error = 0;
+ idx->emu_string->modificar_registro(idx->emu_string, array[i].clave.i_clave, salvar, strlen(salvar)+1, &error);
+ } else {
+ free(primera);
+ primera = actual;
+ }
+ }
+
+ free(primera);
+}
+
+static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header)
+{
+ char *primera, *actual, *resto, salvar[100];
+ EMUFS_REG_SIZE size;
+ int error, i;
+ int iguales;
+
+ /* Agarro la primer clave entera como referencia */
+ primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error);
+ for(i=1; i<header->cant; i++) {
+ actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error);
+ if (*actual == '*') {
+ free(actual);
+ continue;
+ }
+ iguales = strtol(actual, &resto, 10);
+ if ((iguales > 0) && (*resto == '|')) {
+ strncpy(salvar, primera, iguales);
+ salvar[iguales] = '\0';
+ strcat(salvar, resto+1); /* +1 para saltar el separador */
+ idx->emu_string->modificar_registro(idx->emu_string, array[i].clave.i_clave, salvar, strlen(salvar)+1, &error);
+ free(actual);
+ } else {
+ free(primera);
+ primera = actual;
+ }
+ }
+
+ free(primera);
+}
+