X-Git-Url: https://git.llucax.com/z.facultad/75.06/emufs.git/blobdiff_plain/9da17243492426daba1cf11c353f4216e7e34ca1..91245c4c700e6740b4d00e1f36b02e05ff96dabd:/emufs/indice_b.c?ds=sidebyside diff --git a/emufs/indice_b.c b/emufs/indice_b.c index 9414c6c..9a5118d 100644 --- a/emufs/indice_b.c +++ b/emufs/indice_b.c @@ -56,6 +56,9 @@ static void b_fundir_nodo(char *, int, char *, int, char *, int, int); static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_DATO nuevo); +static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); +static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header); + void emufs_indice_b_crear(INDICE *idx) { FILE *fp; @@ -68,8 +71,6 @@ void emufs_indice_b_crear(INDICE *idx) header.hijo_izquierdo = -1; fp = fopen(idx->filename, "w"); - PERR("Creando indice"); - fprintf(stderr, "Archivo = (%s)\n", idx->filename); if (fp == NULL) { PERR("Error al crear el archivo"); return; @@ -104,18 +105,21 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) b_leer_header(nodo, &header); claves = b_leer_claves(nodo, &header); i=0; - PERR("!!!!!!!!!!!!!!!!!!!!! 1 !!!!!!!!!!!!!!!!!!!"); while ((itipo == IND_PRIMARIO) { + if (idx->funcion == IND_PRIMARIO) { PERR("Indice primario no puede contener claves duplicadas!"); + PERR(idx->nombre); return 0; } /* TODO : Implementar carga de valor en clave duplicada! */ b_insertar_dup_en_pos(idx, claves[i].dato, dato); - + + if (idx->tipo_dato == IDX_STRING) { + /* Tengo que sacar el texto repetido del archivo de textos */ + idx->emu_string->borrar_registro(idx->emu_string, clave); + } return 1; } else { if (i == 0) { @@ -132,18 +136,15 @@ int emufs_indice_b_insertar(INDICE *idx, CLAVE clave, INDICE_DATO dato) nodo = padre; nodo_id = padre_id; - if (idx->tipo != IND_PRIMARIO) { + if (idx->funcion != IND_PRIMARIO) { /* Agrego el DATO real al archivo de claves repetiras * y me guardo el ID para poner en el indice */ dummy.id = -1; dato.id = b_insertar_dup_en_pos(idx, dummy, dato); - fprintf(stderr, "Agrege un coso duplicado por primera vez en id=%d\n", dato.id); } - PERR("---------- 1 ------------"); b_insertar_en_nodo(idx, clave, dato, nodo_id, nodo, -1, -1); - PERR("---------- 2 ------------"); return 1; /* Agregar OK! */ } @@ -154,30 +155,30 @@ INDICE_DATO emufs_indice_b_buscar(INDICE *idx, CLAVE clave) B_NodoHeader header; B_NodoEntry *claves; char *nodo, *tmp; - - if (idx->tipo != IND_PRIMARIO) { - /* SOLO SE PUEDE BUSCAR CON CLAVE UNICA! */ - ret.id = ret.bloque = -1; - return ret; - } + int nodo_id; /* Leo la raiz */ nodo = b_leer_nodo(idx, 0); + nodo_id = 0; while (nodo) { b_leer_header(nodo, &header); claves = b_leer_claves(nodo, &header); i=0; while ((itipo_dato == IDX_STRING) { + b_leer_header(out, &header); + claves = b_leer_claves(out, &header); + desabreviar_claves(idx, claves, &header); + } fclose(fp); return out; } @@ -297,24 +305,15 @@ static char *b_leer_nodo(INDICE *idx, int id) static void b_grabar_nodo(INDICE *idx, int id, char *data) { FILE *fp; + B_NodoHeader header; + B_NodoEntry *claves; -/* if (id > b_ultimo_id()) { - printf("AGREGANDO AL FINAL\n"); - fp = fopen(FILENAME, "a"); - if (fp == NULL) { - _("No se pudo abrir archivo\n"); - return; - } - } else { - fp = fopen(FILENAME, "w"); - if (fp == NULL) { - _("No se pudo abrir archivo\n"); - return; - } - fseek(fp, id*BLOCK_SIZE, SEEK_SET); - printf("SOLO GUARDO DATA\n"); - }*/ - + /* Si las claves son de tipo string debo abreviar antes de guardar */ + if (idx->tipo_dato == IDX_STRING) { + b_leer_header(data, &header); + claves = b_leer_claves(data, &header); + abreviar_claves(idx, claves, &header); + } fp = fopen(idx->filename, "r+"); fseek(fp, id*idx->tam_bloque, SEEK_SET); fwrite(data, 1, idx->tam_bloque, fp); @@ -371,17 +370,25 @@ static void b_insertar_en_nodo(INDICE *idx, CLAVE clave, INDICE_DATO dato, int n i=0; /* Creo una lista ordenada de los nodos a partir */ tmp_claves = (B_NodoEntry *)malloc(sizeof(B_NodoEntry)*(nodo_header.cant+1)); - total = nodo_header.cant; - PERR("@@@@@@@@@@@@@@@@@@@@@@@@@@@@"); + total = nodo_header.cant+1; while ((itam_bloque-sizeof(B_NodoHeader)); for(j=0; jtam_bloque-sizeof(B_NodoHeader)); for(j=0; j 0) { int j; - PERR("$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$"); while ((i < nodo_header.cant) && (emufs_indice_es_menor(idx, claves[i].clave, clave))) i++; - PERR("$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$"); for(j=nodo_header.cant; j > i; j--) claves[j] = claves[j-1]; } nodo_header.cant++; claves[i].clave = clave; claves[i].dato = dato; - claves[i].hijo_derecho = hijo2; - nodo_header.hijo_izquierdo = b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1); + if (i==0) { + nodo_header.hijo_izquierdo = hijo1; + claves[i].hijo_derecho = hijo2; + } else { + claves[i-1].hijo_derecho = hijo1; + claves[i].hijo_derecho = hijo2; + } + /*b_elegir_izquierdo(idx, nodo_header.hijo_izquierdo, hijo1);*/ b_actualizar_header(nodo, &nodo_header); b_grabar_nodo(idx, nodo_id, nodo); @@ -534,12 +545,10 @@ static int b_elegir_izquierdo(INDICE *idx, int a, int b) claves1 = b_leer_claves(nodo1, &header1); claves2 = b_leer_claves(nodo2, &header2); - PERR("==========1============"); if (emufs_indice_es_menor(idx, claves1[0].clave, claves2[0].clave)) cual = a; else cual = b; - PERR("==========2============"); free(nodo1); free(nodo2); @@ -557,15 +566,20 @@ INDICE_DATO *emufs_indice_b_buscar_muchos(INDICE *idx, CLAVE clave, int *cant) /* Si el indice es primario no tiene sentido hacer nada */ if (idx->funcion == IND_PRIMARIO) { *cant = 0; + PERR("INDICE PRIMARIO NO SOPORTA BUSQUEDA MULTIPLE"); return NULL; } /* Busco la clave en el arbol */ dato = emufs_indice_b_buscar(idx, clave); + if (dato.id == -1) { + PERR("CLAvE NO ENCONTRADA EN EL ARBOL!"); + } /* Leo el contenido actual */ k.i_clave = dato.id; + error = 0; leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error); /* Incremento en 1 la cantidad */ @@ -815,6 +829,7 @@ static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_D /* Leo el contenido actual */ k.i_clave = pos.id; + error = 0; leido = (char *)idx->emu_mult->leer_registro(idx->emu_mult, k, &tam, &error); /* Incremento en 1 la cantidad */ @@ -836,27 +851,108 @@ static EMUFS_REG_ID b_insertar_dup_en_pos(INDICE *idx, INDICE_DATO pos, INDICE_D (*((int *)leido)) = cant; /* Salvo */ - PERR("b_insertar_dup_en_pos"); if (k.i_clave == -1) { /* Creo uno nuevo */ error = 0; k.i_clave = idx->emu_mult->grabar_registro(idx->emu_mult, - leido, - cant*sizeof(INDICE_DATO)+sizeof(int), - &error - ); + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error + ); + if (k.i_clave == -1) PERR("ALGO NO GRABO BIEN!!"); } else { /* Modifico el que ya existia! */ error = 0; idx->emu_mult->modificar_registro(idx->emu_mult, - k.i_clave, - leido, - cant*sizeof(INDICE_DATO)+sizeof(int), - &error - ); + k.i_clave, + leido, + cant*sizeof(INDICE_DATO)+sizeof(int), + &error + ); } /* Clean up! */ free(leido); return k.i_clave; } +char *abreviar(char *primera, char *actual, int *iguales) +{ + (*iguales) = 0; + while (((*primera) != '\0') && ((*actual) != '\0')) { + if ((*primera) == (*actual)) { + primera++; + actual++; + (*iguales)++; + } else { + /* No coinciden mas! */ + break; + } + } + + return actual; +} + +static void abreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header) +{ + char *primera, *actual, *resto, salvar[100]; + EMUFS_REG_SIZE size; + int error, i; + int iguales; + + /* Agarro la primer clave entera como referencia */ + primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error); + for(i=1; icant; i++) { + actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error); + if (*actual == '*') { + free(actual); + continue; + } + resto = abreviar(primera, actual, &iguales); + /* Para que tenga sentido abreviar tengo que tener + * mas de 2 letras iguales, si no no gano nada y complica las cosas + */ + if (iguales > 1) { + sprintf(salvar, "%d|%s", iguales, resto); + free(actual); + error = 0; + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave.i_clave, salvar, strlen(salvar)+1, &error); + } else { + free(primera); + primera = actual; + } + } + + free(primera); +} + +static void desabreviar_claves(INDICE *idx, B_NodoEntry *array, B_NodoHeader *header) +{ + char *primera, *actual, *resto, salvar[100]; + EMUFS_REG_SIZE size; + int error, i; + int iguales; + + /* Agarro la primer clave entera como referencia */ + primera = (char *)idx->emu_string->leer_registro(idx->emu_string, array[0].clave, &size, &error); + for(i=1; icant; i++) { + actual = (char *)idx->emu_string->leer_registro(idx->emu_string, array[i].clave, &size, &error); + if (*actual == '*') { + free(actual); + continue; + } + iguales = strtol(actual, &resto, 10); + if ((iguales > 0) && (*resto == '|')) { + strncpy(salvar, primera, iguales); + salvar[iguales] = '\0'; + strcat(salvar, resto+1); /* +1 para saltar el separador */ + idx->emu_string->modificar_registro(idx->emu_string, array[i].clave.i_clave, salvar, strlen(salvar)+1, &error); + free(actual); + } else { + free(primera); + primera = actual; + } + } + + free(primera); +} +