doc/informeChapter5.lyx

   1 #LyX 1.3 created this file. For more info see http://www.lyx.org/
   2 \lyxformat 221
   3 \textclass book
   4 \language spanish
   5 \inputencoding auto
   6 \fontscheme palatino
   7 \graphics default
   8 \paperfontsize default
   9 \spacing single
  10 \papersize a4paper
  11 \paperpackage widemarginsa4
  12 \use_geometry 0
  13 \use_amsmath 0
  14 \use_natbib 0
  15 \use_numerical_citations 0
  16 \paperorientation portrait
  17 \secnumdepth 3
  18 \tocdepth 3
  19 \paragraph_separation indent
  20 \defskip medskip
  21 \quotes_language english
  22 \quotes_times 2
  23 \papercolumns 1
  24 \papersides 1
  25 \paperpagestyle default
  26
  27 \layout Chapter
  28
  29 Archivo sin bloques y registros de longitud variable
  30 \layout Standard
  31
  32 Este tipo de archivo nos traerá a la mesa la particularidad de grabar registros
  33  de longitud variablesin realizar su agrupación en bloques, y como veremos
  34  en la siguiente sección, tambien permitirá la administración de gaps que
  35  queden en el archivo luego de operaciones de baja de registros.
  36 \layout Section
  37
  38 Organización física
  39 \layout Standard
  40
  41 Este tipo de archivo realizará el almacenamiento de registros de longitud
  42  variable en disco, su borrado y modificación sin la utilización de bloques
  43  de ningún tipo.
  44  Su implementación se encuentra en los archivos fuente (
  45 \series bold
  46 tipo2.c
  47 \series default
  48  y
  49 \series bold
  50 tipo2.h
  51 \series default
  52 ).
  53 \newline
  54
  55 \layout Standard
  56
  57 Los archivos del tipo 2, presentarán al comienzo del mismo un header compuesto
  58  simplemente por un dato del tipo EMUFS_Tipo (int) el cual indicará el tipo
  59  de archivo en cuestión.
  60 \newline
  61
  62 \layout Standard
  63
  64 Para poder entender mejor la organización fisica de este tipo de archivo,
  65  tomemos el caso hipotético en el que se encuentran grabados
  66 \series bold
  67 dos registros
  68 \series default
  69  (comenzando desde registro 0) de
  70 \series bold
  71 30 bytes
  72 \series default
  73 , y
  74 \series bold
  75 25 bytes
  76 \series default
  77 , respectivamente.
  78  Supongamos también que entre el registro 0 y 1 se encontraba un
  79 \series bold
  80 registro de 10 bytes
  81 \series default
  82  que fue
  83 \series bold
  84 borrado
  85 \series default
  86 , generando un
  87 \series bold
  88 gap
  89 \series default
  90
  91 \series bold
  92 o freespace
  93 \series default
  94 .
  95  Si miramos al archivo de datos (.DAT) en el disco nos encontraremos con
  96  lo siguiente:
  97 \newline
  98
  99 \newline
 100
 101 \begin_inset Graphics
 102         filename graphics/Example1.png
 103         width 100text%
 104
 105 \end_inset
 106
 107
 108 \newline
 109
 110 \newline
 111 Como se puede observar, a nivel físico cada registro grabado esta compuesto
 112  por un Header cuyo tamaño total es de 8 bytes (
 113 \series bold
 114 EMUFS_REG_ID
 115 \series default
 116  +
 117 \series bold
 118 EMUFS_REG_SIZE
 119 \series default
 120 ), y posteriormente el registro (bloque de datos) en sí.
 121  Luego se encuentra el espacio libre de 18 bytes dejado por el registro
 122  de 10 bytes eliminado (10 bytes de datos + header de 8 bytes) y finalmente
 123  el segundo registro mencionado.dsds
 124 \layout Section
 125
 126 Comportamiento (funciones de la interfáz)
 127 \layout Standard
 128
 129 Dentro de
 130 \series bold
 131 \emph on
 132 tipo2.h
 133 \series default
 134 \emph default
 135  y
 136 \series bold
 137 \emph on
 138 tipo2.c
 139 \series default
 140 \emph default
 141  se encuentran las cabeceras y la implementación de las funciones principales
 142  respectivamente, las cuales dan funcionalidad a esta organización.
 143
 144 \layout Standard
 145
 146 A continuación se comentará el funcionamiento algunas de las mas importantes.
 147 \layout Subsection
 148
 149 Lectura de registros
 150 \layout Standard
 151
 152 Como se vió al comienzo, los registros en este tipo de archivo no se encuentran
 153  agrupados en bloques de ninguna índole y estan dispersos a lo largo del
 154  archivo, con la particularidad de que pueden existir gaps o espacio libre,
 155  entre dos registros dados.
 156 \newline
 157
 158 \layout Standard
 159
 160 Por ende la lectura de registros en este tipo de organización es muy simple
 161  y dada la inexistencia de bloques, el procedimiento será el siguiente:
 162 \layout Enumerate
 163
 164 Se determina el offset en bytes, donde comienza el registro deseado, a través
 165  de su ID, buscando la misma en el archivo índice (
 166 \series bold
 167 .idx
 168 \series default
 169 )
 170 \layout Enumerate
 171
 172 Ya determinada la posición física del registro dentro del archivo de datos
 173  (
 174 \series bold
 175 .dat
 176 \series default
 177 ), nos posicionamos en la misma, y leemos el header del registro (
 178 \series bold
 179 IDReg
 180 \series default
 181  +
 182 \series bold
 183 RegSize
 184 \series default
 185 ).
 186  Contando así con el tamaño del registro, procedemos a leer el mismo (los
 187  datos), dando por finalizada la lectura.
 188 \layout Subsection
 189
 190 Altas de registros
 191 \layout Standard
 192
 193 En el proceso de alta de registros entrarán en juego dos archivos descriptos
 194  en la
 195 \emph on
 196 sección de archivos auxiliares
 197 \emph default
 198 , siendo estos el archivo índice (
 199 \series bold
 200 .idx
 201 \series default
 202 ), y el archivo de gaps / espacios libres (
 203 \series bold
 204 .fsc
 205 \series default
 206 ).
 207
 208 \newline
 209
 210 \layout Standard
 211
 212 Así pues, a la hora de realizar una inserción de un registro en el archivo
 213  de datos, el procedimiento será el siguiente:
 214 \layout Enumerate
 215
 216 Calculamos el espacio que necesitaremos para el registro: sizeof(
 217 \series bold
 218 EMUFS_REG_ID
 219 \series default
 220 ) + sizeof(
 221 \series bold
 222 EMUFS_REG_SIZE
 223 \series default
 224 ) + sizeof(registro).
 225 \layout Enumerate
 226
 227 Determinamos donde debemos insertar el registro, ya sea un gap donde entre,
 228  o bien al final del archivo.
 229 \layout Enumerate
 230
 231 Insertamos el registro e información de control (
 232 \series bold
 233 header
 234 \series default
 235 +
 236 \series bold
 237 data
 238 \series default
 239 ), en la posición indicada en el paso 2.
 240 \layout Enumerate
 241
 242 En caso de haber utilizado un GAP, actualizamos el espacio libre restante
 243  en el mismo y en caso de que se haya utilizado al totalidad del GAP, se
 244  lo elimina del archivo (
 245 \series bold
 246 .fsc
 247 \series default
 248 ).
 249 \layout Enumerate
 250
 251 Actualizamos la entrada correspondiente al registro ingresado (determinada
 252  por su RegID), en el archivo índice (
 253 \series bold
 254 .idx
 255 \series default
 256 ), indicando su offset donde podrá ser accedido luego.
 257 \layout Subsection
 258
 259 Bajas de registros
 260 \layout Standard
 261
 262 En el proceso de baja de registros entrarán en juego los tres archivos descripto
 263 s en la
 264 \emph on
 265 sección de archivos auxiliares
 266 \emph default
 267 , siendo estos el archivo índice (
 268 \series bold
 269 .idx
 270 \series default
 271 ), el archivo de gaps / espacios libres (
 272 \series bold
 273 .fsc
 274 \series default
 275 ) y el archivo de ID's liberados (
 276 \series bold
 277 .did
 278 \series default
 279 ).
 280 \newline
 281
 282 \layout Standard
 283
 284 Dado que en la implementación de este tipo de organización física contamos
 285  con los gaps o espacios libres entre registros, no se eliminará fisicamente
 286  el registro del archivo de datos (
 287 \series bold
 288 .dat
 289 \series default
 290 ), pues entonces carecería de sentido el archivo anteriormente mencionado
 291  (
 292 \series bold
 293 .fsc
 294 \series default
 295 ).
 296  En cambio, se agrega el gap dejado por la eliminación a dicho archivo,
 297  y se marca fisicamente en el archivo de datos la eliminación mediante un
 298  fill de los bytes correspondientes con un caracter nulo.
 299  (hexa 00 y con el propósito de probar fehacientemente que el sistema funciona).
 300 \newline
 301
 302 \layout Standard
 303
 304 El proceso de baja o eliminación de un registro constará luego de los siguientes
 305  pasos:
 306 \layout Enumerate
 307
 308 Se obtiene el offset o posición relativa en donde se encuentra grabado el
 309  registro dentro del archivo de datos.
 310 \layout Enumerate
 311
 312 Se obtiene el tamaño del registro y se realiza un dummyfill del sector del
 313  archivo correspondiente al registro que se está dando de baja.
 314  (Se rellena la zona correspondiente a su header+data).
 315 \layout Enumerate
 316
 317 Se agrega el GAP generado al archivo de gaps o espacios libres, y en caso
 318  de haberse generado un GAP lindante con otro GAP, se realizará un merge
 319  de los mismos y se los registrará bajo una única entrada en el archivo
 320  de espacios libres (.fsc).
 321 \layout Enumerate
 322
 323 Se agrega el ID que fue liberado, al archivo de ID's liberados (
 324 \series bold
 325 .did
 326 \series default
 327 ), al final del mismo (
 328 \emph on
 329 pila
 330 \emph default
 331 ).
 332 \layout Enumerate
 333
 334 Se marca en el archivo índice (
 335 \series bold
 336 .idx
 337 \series default
 338 ) la eliminación, mediante el valor ¨-1¨ en el registro correspondiente
 339  al registro recién eliminado (se le cambia el valor al n-esimo registro,
 340  donde N = IDReg del reg eliminado).
 341 \layout Subsection
 342
 343 Modificación de registros
 344 \layout Standard
 345
 346 Dada la naturaleza del archivo de ID's liberados, y el manejo de espacio
 347  libre del que consta esta organización de archivo, el proceso de modificación
 348  de un registro se limita a los siguientes pasos:
 349 \layout Enumerate
 350
 351 Se realiza la lectura del registro, mediante el respectivo procedimiento
 352  ya desarollado anteriormente.
 353 \layout Enumerate
 354
 355 Una vez que se cuenta con los nuevos datos modificados, se procede a dar
 356  de baja el registro que ha sido modificado, e inmediatamente después se
 357  realiza una inserción con los nuevos datos.
 358 \layout Standard
 359
 360
 361 \series bold
 362 \emph on
 363 NOTA:
 364 \series default
 365 \emph default
 366  Como fue indicado, dada la naturaleza de PILA del subsistema de administración
 367  de ID liberados, es asegurado que la nueva inserción del registro modificado
 368  se realizará con el mismo RegID.
 369 \layout Subsection
 370
 371 Obtención de estadísticas
 372 \layout Subsection
 373
 374 Compactación del archivo de datos
 375 \layout Standard
 376
 377 Asi como los otros dos tipos de datos, el que nos compete también cuenta
 378  con la posibilidad de realizar la compactación de datos cuando el usuario
 379  lo desee, justificando todos los registros a izquierda, eliminando así
 380  los gaps existentes y decrementando el tamaño del archivo en disco (truncandolo
 381 ).
 382 \layout Standard
 383
 384 Para poder comprender como hemos implementado el proceso de recompactación
 385  en nuestro tipo de archivo 2, nos ayudaremos de esquemas a través de los
 386  cuales iremos describiendo el proceso.
 387  Notemos antes, que el proceso de compactación esta directamente ligado
 388  con el archivo de gaps o espacios libres (
 389 \series bold
 390 .fsc
 391 \series default
 392 )
 393 \newline
 394
 395 \layout Standard
 396
 397 Comenzemos con el siguiente cuadro situacional:
 398 \newline
 399
 400 \newline
 401
 402 \begin_inset Graphics
 403         filename graphics/Compact1.png
 404         width 100text%
 405         keepAspectRatio
 406
 407 \end_inset
 408
 409
 410 \newline
 411
 412 \layout Standard
 413
 414 Partiendo de esta base, el algoritmo de compactación tomará en su inicio
 415  al primer gap existente dentro del archivo de datos, en este caso llamado
 416
 417 \series bold
 418 Gap0
 419 \series default
 420 .
 421  Luego, establecerá que el
 422 \series bold
 423 Source
 424 \series default
 425  a partir de donde se quieren mover datos, sera:
 426 \newline
 427
 428 \layout Standard
 429
 430
 431 \series bold
 432 StartGap0
 433 \series default
 434  +
 435 \series bold
 436 SizeGap0
 437 \series default
 438  =
 439 \series bold
 440 EndGap0
 441 \series default
 442  =
 443 \series bold
 444 Source
 445 \newline
 446
 447 \layout Standard
 448
 449 Lo cual no es nada más y nada menos que lo obvio, la fuente a partir de
 450  donde se mueven los datos, sera el fin del primer gap, donde comienzan
 451  datos.
 452  Como destino (
 453 \series bold
 454 Destination
 455 \series default
 456 ) del movimiento, se establece inicialmente, el inicio del gap, o sea
 457 \series bold
 458 StartGap0 = Destination
 459 \series default
 460 .
 461 \layout Standard
 462
 463 Luego, el algoritmo entrara en un bucle while (mientras haya bucles por
 464  levantar), el cual trabajara hasta el final de la compactación de la siguiente
 465  manera:
 466 \newline
 467
 468 \layout Standard
 469
 470
 471 \series bold
 472 Mientras haya Gaps
 473 \series default
 474  {
 475 \layout Enumerate
 476
 477 Se levanta el proximo gap al levantado en una instancia previa.
 478  En este ejemplo, durante el primer loop del while, se levantará
 479 \series bold
 480 Gap1
 481 \layout Enumerate
 482
 483 Luego, se calcula cuantos bytes hay que mover hacia el Destination de la
 484  siguiente manera:
 485 \layout Enumerate
 486
 487
 488 \series bold
 489 Mustmove_bytes
 490 \series default
 491  =
 492 \series bold
 493 StartGap1
 494 \series default
 495  -
 496 \series bold
 497 Source
 498 \series default
 499  =
 500 \series bold
 501 StartGap1
 502 \series default
 503  -
 504 \series bold
 505 EndGap0 (
 506 \series default
 507 Lo cual nuevamente es lógico pues querremos mover lo que se encuentra entre
 508  el final del primer gap levantado y el inicio del siguiente).
 509 \layout Enumerate
 510
 511 Se realiza el movimiento de los datos, utilizando las direcciones
 512 \series bold
 513 Source
 514 \series default
 515  y
 516 \series bold
 517 Destination
 518 \series default
 519 , así como la variable
 520 \series bold
 521 Mustmove_bytes
 522 \series default
 523  que nos indica cuantos bytes transferir.
 524
 525 \series bold
 526
 527 \newline
 528
 529 \newline
 530 IMPORTANTE:
 531 \emph on
 532 La transferencia se hace de a chunks de 25 bytes + un resto segun el valor
 533  de Mustmove_bytes.
 534 \layout Enumerate
 535
 536 Se establece como gap de referencia, al ultimo gap leido (En este caso se
 537  realiza:
 538 \series bold
 539 StartGap0
 540 \series default
 541  =
 542 \series bold
 543 StartGap1
 544 \series default
 545 ,
 546 \series bold
 547 Gap0Size = Gap1Size
 548 \series default
 549 ) y termina el código de repetición del bucle, dando lugar a la carga del
 550  siguiente gap en el inicio del mismo.
 551 \layout Standard
 552
 553
 554 \series bold
 555 }
 556 \newline
 557
 558 \layout Standard
 559
 560 Luego del primer bucle, el archivo se vera de la siguiente forma:
 561 \newline
 562
 563 \newline
 564
 565 \begin_inset Graphics
 566         filename graphics/Compact2.png
 567         width 100text%
 568
 569 \end_inset
 570
 571
 572 \newline
 573
 574 \layout Standard
 575
 576 Notemos que al final de la porción de datos de los bytes movidos (donde
 577  quedo apuntando
 578 \series bold
 579 Destination
 580 \series default
 581 ), hay basura que será pisada por el próximo movimiento.
 582 \newline
 583
 584 \layout Standard
 585
 586 En el próximo loop, el bucle levantará un nuevo gap, y utilizando el gap
 587  anterior (En esta caso el Gap anterior será
 588 \series bold
 589 Gap1
 590 \series default
 591 ) como referencia, realizará los mismos cálculos, desde donde transferir
 592  y cuantos bytes mover.
 593  (El destino es solo establecido inicialmente por código, y para el resto
 594  del algoritmo es el lugar donde quedo el puntero destination luego de la
 595  última escritura).
 596 \layout Standard
 597
 598 Una vez que se salga del bucle while, se realizará un último movimiento
 599  preprogramado, donde la fuente (
 600 \series bold
 601 Source
 602 \series default
 603 ) será el final del ultimo gap, y la cantidad de bytes a mover será lo que
 604  se encuentre luego del mismo hasta el fin de archivo.
 605 \newline
 606
 607 \layout Standard
 608
 609
 610 \series bold
 611 Source = StartLastGap + SizeLastGap = EndLastGap
 612 \layout Standard
 613
 614
 615 \series bold
 616 Mustmove_bytes = Datsize - Source
 617 \series default
 618
 619 \newline
 620
 621 \layout Standard
 622
 623 Damos por terminada así, la explicación del algoritmo de compresión el cual
 624  para el caso del tipo 2, es realmente bastante sencillo.
 625 \layout Section
 626
 627 Detalles de implementación (funciones internas, ver si lo ponemos o no)
 628 \the_end