/** Junta 2 nodos y hace uno solo */
static void b_fundir_nodo(INDICE *,char *, int, char *, int, char *, int, int);
/** Crea 3 nodos a partir de 2 llenos */
-static void b_partir_dos_nodos_en_tres(INDICE*, int nodo_izq, int nodo_der, int padre, B_NodoEntry nuevo_entry);
+static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre);
static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo);
static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header);
+int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k, INDICE_DATO dato);
void emufs_indice_b_crear(INDICE *idx)
{
memcpy(bloque, &header, sizeof(B_NodoHeader));
fwrite(bloque, idx->tam_bloque, 1, fp);
+ free(bloque);
fclose(fp);
}
PERR(idx->nombre);
return 0;
}
-
- /* TODO : Implementar carga de valor en clave duplicada! */
- b_insertar_dup_en_pos(idx, claves[i].dato, dato);
+
+ if ((idx->funcion == IND_SELECCION) && (!emufs_indice_es_clave_nula(idx, clave)))
+ b_insertar_dup_en_pos(idx, claves[i].dato, dato);
if (idx->tipo_dato == IDX_STRING) {
/* Tengo que sacar el texto repetido del archivo de textos */
- idx->emu_string->borrar_registro(idx->emu_string, clave);
+ idx->emu_string->borrar_registro(idx->emu_string, clave, dummy);
}
return 1;
} else {
/* Agrego el DATO real al archivo de claves repetiras
* y me guardo el ID para poner en el indice
*/
+ if ((idx->funcion == IND_SELECCION) && (emufs_indice_es_clave_nula(idx, clave)))
+ /* UPS!, la clave que se va a insertar por primera vez es nula
+ * y soy un indice selectivo!, no lo puedo permitir, ciao!!
+ */
+ return 1;
dummy.id = -1;
dato.id = b_insertar_dup_en_pos(idx, dummy, dato);
}
return ret;
}
-int emufs_indice_b_borrar(INDICE *idx, CLAVE k)
+int emufs_indice_b_borrar(INDICE *idx, CLAVE k, INDICE_DATO dato)
{
/* Busco el nodo que contiene la clave,si es que esta existe */
char *nodo;
if (encontrado) {
PERR("Clave encontrada, borrando ...");
- fprintf(stderr, "La clave a borrar esta en el nodo %d\n", nodo_id);
- b_borrar_clave(idx, nodo, nodo_id, k);
+ if (idx->funcion != IND_PRIMARIO) {
+ /* Debo borrar primero la clave desde el archivo de
+ * claves repetidas, y si recien ahi me quedo sin claves,
+ * borrar la clave del arbol
+ */
+ PERR("Vamos a borrar duplicados");
+ encontrado = b_borrar_dup_clave(idx, claves[i].dato, dato);
+ }
+ if (encontrado) {
+ b_borrar_clave(idx, nodo, nodo_id, k);
+ }
} else {
PERR("Clave no encontrada");
}
{
FILE *fp;
char *out;
- B_NodoHeader header;
- B_NodoEntry *claves;
+ /*B_NodoHeader header;
+ B_NodoEntry *claves;*/
if (id < 0) return NULL;
}
/* Si estoy manejando string tengo que sacar las abreviaturas */
- if (idx->tipo_dato == IDX_STRING) {
+/* if (idx->tipo_dato == IDX_STRING) {
b_leer_header(out, &header);
claves = b_leer_claves(out, &header);
desabreviar_claves(idx, claves, &header);
- }
+ }*/
fclose(fp);
return out;
}
static void b_grabar_nodo(INDICE *idx, int id, char *data)
{
FILE *fp;
- B_NodoHeader header;
- B_NodoEntry *claves;
+ /*B_NodoHeader header;
+ B_NodoEntry *claves;*/
/* Si las claves son de tipo string debo abreviar antes de guardar */
- if (idx->tipo_dato == IDX_STRING) {
+/* if (idx->tipo_dato == IDX_STRING) {
b_leer_header(data, &header);
claves = b_leer_claves(data, &header);
abreviar_claves(idx, claves, &header);
- }
+ }*/
fp = fopen(idx->filename, "r+");
fseek(fp, id*idx->tam_bloque, SEEK_SET);
fwrite(data, 1, idx->tam_bloque, fp);
hijo1 = nodo_id;
hijo2 = nuevo_id;
- fprintf(stderr, "Nodos espliteados = %d %d\n", hijo1, hijo2);
nodo = padre;
nodo_id = nodo_header.padre;
} else {
hijo1 = nuevo_id+1;
hijo2 = nuevo_id;
- fprintf(stderr, "Nodos espliteados = %d %d\n", hijo1, hijo2);
/* Limpio al padre */
nuevo = b_leer_nodo(idx, 0);
nuevo_header.padre = -1;
nuevo_header.nivel = nodo_header.nivel+1;
nuevo_header.hijo_izquierdo = -1;
- fprintf(stderr, "root.nivel=%d\n", nuevo_header.nivel);
memset(nuevo, -1, idx->tam_bloque);
b_actualizar_header(nuevo, &nuevo_header);
b_grabar_nodo(idx, 0, nuevo);
claves[i-1].hijo_derecho = hijo_izq;
claves[i].hijo_derecho = hijo_der;
}
- /*b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);*/
b_actualizar_header(nodo, &nodo_header);
b_grabar_nodo(idx, nodo_id, nodo);
char* nuevo = b_leer_nodo(idx, hijo_izq);
if (nuevo != NULL) {
B_NodoHeader nuevo_header;
- fprintf(stderr, "Actualizo padre de %d a %d\n", hijo_izq, nodo_id);
b_leer_header(nuevo, &nuevo_header);
nuevo_header.padre = nodo_id;
b_actualizar_header(nuevo, &nuevo_header);
char* nuevo = b_leer_nodo(idx, hijo_der);
if (nuevo != NULL) {
B_NodoHeader nuevo_header;
- fprintf(stderr, "Actualizo padre de %d a %d\n", hijo_der, nodo_id);
b_leer_header(nuevo, &nuevo_header);
nuevo_header.padre = nodo_id;
b_actualizar_header(nuevo, &nuevo_header);
while (emufs_indice_es_menor(idx, claves[pos].clave, k)) pos++;
/* Es el nodo una hoja? */
- fprintf(stderr, "La clave esta en la pos = %d\n", pos);
if (header.hijo_izquierdo != -1) {
PERR("Nodo no es hoja, intercambio");
-/* if (pos == 0) {
- actual = b_leer_nodo(idx, nodo_header.hijo_izquierdo);
- else*/
actual = b_leer_nodo(idx, claves[pos].hijo_derecho);
actual_id = claves[pos].hijo_derecho;
p = claves[pos].hijo_derecho;
/* Se cumple la condicion de hijos? */
PERR("Dejo todo consistente");
- fprintf(stderr, "Condicion : %d >= %d\n", header_actual.cant, MIN_HIJOS(idx));
- if (header_actual.cant >= MIN_HIJOS(idx)) {
+ if ((header_actual.cant >= MIN_HIJOS(idx)) || (actual_id == 0)) {
PERR("Borrar completo sin fundir");
return;
}
/* Tengo que pasar datos o fundir nodos :-( */
do {
padre_id = header.padre;
+ if (padre_id == -1) continue;
padre = b_leer_nodo(idx, padre_id);
b_leer_header(padre, &header_padre);
claves_padre = b_leer_claves(padre, &header_padre);
- fprintf(stderr, "ID del padre = %d de nivel %d\n", padre_id, header_padre.nivel);
/* TODO Tengo el hijo_izquierdo para revisar!! XXX */
if (header_padre.hijo_izquierdo == actual_id) {
PERR("Soy el hijo izquierdo de padre");
derecha_id = claves_padre[0].hijo_derecho;
der = b_leer_nodo(idx, derecha_id);
b_leer_header(der, &header_der);
+ pos_padre = 0;
} else {
PERR("Buscando que hijo soy");
for(pos_padre=0; (claves_padre[pos_padre].hijo_derecho != actual_id); pos_padre++) { }
PERR("Ta calcule lo que tengo que hacer");
if ((derecha_id != -1) && (header_der.cant > MIN_HIJOS(idx))) {
PERR("Le pido clave a derecha");
- fprintf(stderr, "ANTES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant);
b_pedir_clave_derecha(der, derecha_id, padre, padre_id, actual, actual_id, pos_padre);
PERR("listo");
b_leer_header(der, &header_der);
b_leer_header(padre, &header_padre);
b_leer_header(actual, &header_actual);
- fprintf(stderr, "DESPUES DE PEDIR DERECHA TENGO %d claves\n", header_actual.cant);
} else if ((izquierda_id != -1) && (header_izq.cant > MIN_HIJOS(idx))) {
PERR("Le pido clave a izquierda");
b_pedir_clave_izquierda(izq, izquierda_id, padre, padre_id, actual, actual_id, pos_padre);
B_NodoHeader h_der, h_padre, h_nodo;
B_NodoEntry *c_der, *c_padre, *c_nodo;
+ PERR("Derecha 1");
b_leer_header(nodo, &h_nodo);
c_nodo = b_leer_claves(nodo, &h_nodo);
b_leer_header(der, &h_der);
b_leer_header(padre, &h_padre);
c_padre = b_leer_claves(padre, &h_padre);
+ PERR("Derecha 2");
c_nodo[h_nodo.cant] = c_padre[pos_clave+1];
c_nodo[h_nodo.cant].hijo_derecho = -1; /* XXX */
+ PERR("Derecha 3");
c_padre[pos_clave+1] = c_der[0];
c_padre[pos_clave+1].hijo_derecho = der_id;
/* Muevo las claves de derecho */
+ PERR("Derecha 4");
for(i=0; i<h_der.cant-1; i++) {
c_der[i] = c_der[i+1];
}
b_actualizar_header(der, &h_der);
b_actualizar_header(nodo, &h_nodo);
+ PERR("Derecha 5");
}
void b_pasar_clave_a_derecha(INDICE *idx, char *der, int der_id, char *padre, int padre_id, int padre_pos, B_NodoEntry entry)
b_leer_header(der, &der_h);
padre_entries = b_leer_claves(padre, &padre_h);
/* Inserto en el hijo derecho la clave del padre */
+ PERR("PASAR CLAVE DERECHA");
b_insertar_en_nodo_con_lugar(idx, padre_entries[padre_pos].clave, padre_entries[padre_pos].dato,
- der_id, der, entry.hijo_derecho, der_h.hijo_izquierdo);
+ der_id, der, der_h.hijo_izquierdo, entry.hijo_derecho);
/* Reemplazo clave del padre por clave nueva */
entry.hijo_derecho = der_id;
padre_entries[padre_pos] = entry;
if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!");
} else {
/* Modifico el que ya existia! */
+ INDICE_DATO dummy;
error = 0;
idx->emu_mult->modificar_registro(idx->emu_mult,
k,
leido,
cant*sizeof(INDICE_DATO)+sizeof(int),
- &error
+ &error,
+ dummy
);
}
/* Clean up! */
* mas de 2 letras iguales, si no no gano nada y complica las cosas
*/
if (iguales > 1) {
+ INDICE_DATO dummy1;
sprintf(salvar, "%d|%s", iguales, resto);
free(actual);
error = 0;
- idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error);
+ idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy1);
} else {
free(primera);
primera = actual;
}
iguales = strtol(actual, &resto, 10);
if ((iguales > 0) && (*resto == '|')) {
+ INDICE_DATO dummy2;
strncpy(salvar, primera, iguales);
salvar[iguales] = '\0';
strcat(salvar, resto+1); /* +1 para saltar el separador */
- idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error);
+ idx->emu_string->modificar_registro(idx->emu_string, array[i].clave, salvar, strlen(salvar)+1, &error, dummy2);
free(actual);
} else {
free(primera);
free(primera);
}
-static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, int padre, B_NodoEntry nuevo_entry)
+void insertar_ordenado(INDICE *idx, B_NodoEntry *buffer, int cant, B_NodoEntry nuevo_entry)
+{
+ int i, pos;
+ for(i=0; (i<cant) && emufs_indice_es_menor(idx, buffer[i].clave, nuevo_entry.clave); i++) {}
+ pos = i;
+
+ for(i=cant; i>pos; i--)
+ buffer[i] = buffer[i-1];
+
+ buffer[pos] = nuevo_entry;
+}
+
+static void b_partir_dos_nodos_en_tres(INDICE* idx, int nodo_izq, int nodo_der, B_NodoEntry padre_entry, B_NodoEntry nuevo_entry, int id_padre)
{
+ PERR("PARTIR 2 EN 3");
+ B_NodoEntry *buffer;
+ char *izq, *der, *padre, *nuevo;
+ B_NodoEntry *c_der, *c_izq, *c_nuevo, prom1, prom2;
+ B_NodoHeader h_der, h_izq, h_nuevo;
+ int i, j, nodo_nuevo;
+ int cant_claves;
+
+ /* Leo los nodos y los datos */
+ der = b_leer_nodo(idx, nodo_der);
+ izq = b_leer_nodo(idx, nodo_izq);
+
+ b_leer_header(der, &h_der);
+ b_leer_header(izq, &h_izq);
+
+ c_der = b_leer_claves(der, &h_der);
+ c_izq = b_leer_claves(izq, &h_izq);
+
+ cant_claves = 2*CANT_HIJOS(idx)+2;
+ buffer = malloc(cant_claves*sizeof(B_NodoEntry));
+
+ for(i=0, j=0; i<h_izq.cant; i++, j++)
+ buffer[j] = c_izq[i];
+
+ buffer[j++] = padre_entry;
+
+ for(i=0; i<h_der.cant; i++, j++)
+ buffer[j] = c_der[i];
+
+ insertar_ordenado(idx, buffer, cant_claves-1, nuevo_entry);
+
+ nuevo = b_crear_nodo(idx, &nodo_nuevo);
+ b_leer_header(nuevo, &h_nuevo);
+ c_nuevo = b_leer_claves(nuevo, &h_nuevo);
+
+ /* lleno el lado derecho e izquierdo */
+ for(i=0, j=0; i<cant_claves/3; i++, j++)
+ c_izq[j] = buffer[i];
+ prom1 = buffer[i++];
+ h_izq.cant = j;
+ for(j=0; i<2*cant_claves/3; i++, j++)
+ c_der[j] = buffer[i];
+ h_der.cant = j;
+ prom2 = buffer[i++];
+ for(j=0; i<cant_claves; i++,j++)
+ c_nuevo[j] = buffer[i];
+ h_nuevo.cant = j;
+
+ /* Actualizo headers y salvo */
+ b_actualizar_header(der, &h_der);
+ b_actualizar_header(izq, &h_izq);
+ b_actualizar_header(nuevo, &h_nuevo);
+ b_grabar_nodo(idx, nodo_izq, izq);
+ b_grabar_nodo(idx, nodo_der, der);
+ b_grabar_nodo(idx, nodo_nuevo, nuevo);
+
+ free(der);
+ free(izq);
+ free(nuevo);
+ padre = b_leer_nodo(idx, id_padre);
+ b_insertar_en_nodo(idx, prom1.clave, prom1.dato, id_padre, padre, nodo_izq, nodo_der);
+ b_insertar_en_nodo(idx, prom2.clave, prom2.dato, id_padre, padre, nodo_der, nodo_nuevo);
+
/*
* PSEUDOCODIGO TODO FIXME XXX TODO FIXME XXX TODO FIXME XXX
*
if ((i<header.cant) && (emufs_indice_es_igual(idx, claves[i].clave, k))) {
/* LA ENCONTRE! , ahora busco la siguiente clave!! */
if ((i+1)<header.cant) {
+ PERR("Joya, hay lugar a la derecha");
if (claves[i].hijo_derecho == -1) {
+ PERR("Y soy hoja!!");
/* Joya!, fue facil, la siguiente va en camino! */
- salida = claves[i].clave;
+ salida = claves[i+1].clave;
free(nodo);
return salida;
}
+ PERR("No soy hoja, busco la hoja de menor");
/* Mmmmm ... la siguiente esta en uno de mis hijo */
/* Necesito la mas chica de las siguientes, para eso
* me voy a mi hijo derecho y de ahi bajo siempre
return salida;
}
+ PERR("Fuck, tengo que ir otro nodo a buscar");
/* Fuck, la siguiente clave la tengo que sacar de padre */
/* Busco al mi padre, perdido en un maremoto hace mucho,muchos
* aƱos
*/
+ tmp = nodo;
+ if (header.padre == -1) {
+ if (nodo_id == 0) {
+ /* Bien, son el nodo raiz y aca tendria que ir hacia mi hijo
+ * derecho
+ */
+ nodo = b_leer_nodo(idx, claves[header.cant-1].hijo_derecho);
+ free(tmp);
+ if (nodo != NULL) {
+ b_leer_header(nodo, &header);
+ claves = b_leer_claves(nodo, &header);
+
+ salida = claves[0].clave;
+ } else
+ salida.i_clave = -1;
+ }
+ return salida;
+ }
free(nodo);
nodo = b_leer_nodo(idx, header.padre);
b_leer_header(nodo, &header);
claves = b_leer_claves(nodo, &header);
i = 0;
- while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) i++;
- if (i<header.cant)
+ PERR("Busco mi siguiente en mi padre");
+ while ((i<header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, k))) {
+ i++;
+ }
+ if (i<header.cant) {
+ PERR("Siguiente clave encontrada");
salida = claves[i].clave;
- else
+ } else {
/* No hay mas claves! */
+ PERR("Busque y busque pero no aparecio");
salida.i_clave = -1;
+ }
return salida;
} else {
tmp = nodo;
}
/* No encontre la clave pasada, no existe */
+ PERR("No encontre la clave pasada!!");
salida.i_clave = -1;
return salida;
}
+int b_borrar_dup_clave(INDICE *idx, INDICE_DATO k_dato, INDICE_DATO dato)
+{
+ int cant, pos, i;
+ EMUFS_REG_SIZE tam;
+ int error=0;
+ INDICE_DATO *array;
+ INDICE_DATO dummy1;
+ char *leido;
+ CLAVE k;
+
+ /* Leo el contenido actual */
+ error = 0;
+ k.i_clave = k_dato.id;
+ leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error);
+
+ if (leido == NULL) {
+ PERR("LEI CUALQUIER COSA, BUG?");
+ return 1;
+ }
+
+ cant = *((int *)leido);
+
+ /* Obtengo un nuevo lugar para el dato nuevo */
+ array = (INDICE_DATO *)(leido+sizeof(int));
+
+ /* busco pos de dato en array */
+ for(pos=0; pos<cant; pos++) {
+ if (array[pos].id == dato.id) break;
+ }
+
+ for(i=pos; i<cant-1; i++)
+ array[pos] = array[pos+1];
+
+ cant--;
+
+ if (cant == 0) {
+ free(leido);
+ /* No tengo mas cosas en esta clave, la borro */
+ PERR("EL REGISTRO MULTIPLE QUEDO VACIO, ELIMINANDO");
+ idx->emu_mult->borrar_registro(idx->emu_mult, k, dummy1);
+ return 0;
+ }
+
+ /* Quito el elemento */
+ leido = realloc(leido, sizeof(int)+cant*sizeof(INDICE_DATO));
+
+ /* Actualizo la cantidad */
+ (*((int *)leido)) = cant;
+
+ error = 0;
+ idx->emu_mult->modificar_registro(idx->emu_mult,
+ k,
+ leido,
+ cant*sizeof(INDICE_DATO)+sizeof(int),
+ &error,
+ dummy1
+ );
+
+ free(leido);
+
+ return cant;
+}
+
+#ifdef NO_TERMINAOD
+EMUFS_Estadisticas emufs_indice_b_obtener_estadisticas(INDICE *idx)
+{
+ EMUFS_Estadisticas stats, st_string, st_multiples;
+
+ stats.tam_archivo = emufs_common_get_file_size(idx->filename);
+ stats.cant_bloques = stats.tam_archivo/idx->tam_bloque;
+
+}
+#endif
+
+#include "indice_b_asc.c"