practicas/tp3_informe/tp_mom.latex

   1 \documentclass[twocolumn]{article}
   2 \usepackage{graphicx}
   3 \usepackage{times}
   4 \usepackage{hyperref}
   5 \usepackage[activeacute,spanish]{babel}
   6 \usepackage{fancyheadings}
   7 % \usepackage[left=0.in,top=1.0in,right=0.75in,bottom=1.0in,nohead,nofoot]{geometry}
   8 \columnsep 0.2in
   9 \parindent 0.2in
  10 \textheight=9.8in
  11 \textwidth=7in
  12 \headsep 0.0in
  13 \topmargin=-1.0in
  14
  15 % Margein : Es 1in - oddsidemargin
  16 \oddsidemargin -0.25in
  17
  18 \setlength{\headrulewidth}{0.0pt}
  19
  20 \renewcommand{\section}[1] {
  21         \begin{center}\Large \bf #1\end{center}
  22 }
  23
  24 \renewcommand{\subsection}[1] {
  25         \begin{center}\bf #1\end{center}
  26 }
  27
  28 %% HEADER
  29 \rhead{\Large \bf Trabajo Pr\'actico Sistemas Distribuidos I 1º C. 2006}
  30
  31 \begin{document}
  32
  33 \title{SISTEMA DE CONTROL DE STOCK DE PRODUCCION: ANALISIS DE
  34        REQUERIMIENTOS DE SISTEMAS DISTRIBUIDOS}
  35
  36 \author{Leandro Lucarella\footnote{Leandro Lucarella, Facultad de
  37 Ingenier\'ia, Universidad de Buenos Aires, llucare@fi.uba.ar} y Ricardo
  38 Markiewicz\footnote{Ricardo Markiewicz, Facultad de Ingenier\'ia,
  39 Universidad de Buenos Aires, rmarkie@fi.uba.ar}}
  40
  41 \maketitle
  42 \thispagestyle{fancy}
  43
  44
  45 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  46 \section{Resumen}
  47
  48 En el presente trabajo proponemos una soluci\'on alternativa para
  49 un Sistema de Control de Stock de Producci\'on para una empresa
  50 automotriz que cuenta con varias plantas en distintos puntos del
  51 pa\'is (Catamarca, C\'ordoba y Chubut). Actualmente utiliza un sistema
  52 centralizado con varios problemas de base. La soluci\'on que proponemos
  53 se basa en un sistema distribuido, utilizando como soporte un un
  54 Middleware asincr\'onico para implementar un Publisher - Subscriber con
  55 actualizaci\'on de informaci\'on y soporte de grupos, para mejorar tanto
  56 la eficiencia como la confiabilidad y escalabilidad del sistema actual.
  57
  58 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  59 \section{Introducci\'on}
  60
  61 La empresa cuenta actualmente con un sistema centralizado (ver
  62 Figura \ref{esquema}) que acarrea varios problemas de base, como la
  63 inoperatividad ante fallas de conectividad, la eficiencia (el servidor
  64 central est\'a al l\'imite de su capacidad) y la falta de escalabilidad
  65 (lo que ser\'a un problema a corto plazo si la empresa crece al ritmo
  66 esperado). Es por esto que presentamos como soluci\'on alternativa
  67 un Middleware orientado a mensajes\cite{MOM} para atacar todas estas
  68 falencias principales del sistema centralizado.
  69
  70 La empresa cuenta con 2 entidades que realizan operaciones bien
  71 diferenciadas sobre el el stock de producci\'on: F\'abricas (producen
  72 stock) y Puntos de Venta (o PDV, que consumen stock). A su vez cada
  73 entidad puede tener otras restricciones sobre las operaciones, como por
  74 ejemplo poder producir s\'olo cierto tipo de producto. Es por esto que
  75 proponemos un Middleware con soporte de grupos\cite{GROUP}. Adem\'as,
  76 dada la naturaleza Productor - Consumidor del problema es que proponemos
  77 adem\'as un modelo Publisher - Subscriber\cite{PUBLISHER} para la
  78 soluci\'on.
  79
  80 \begin{figure}
  81 \begin{center}
  82 \includegraphics[width=3.0in]{esquema.eps}
  83 \caption{Infrastructura actual del sistema}
  84 \label{esquema}
  85 \end{center}
  86 \end{figure}
  87
  88 La conectividad a nivel nacional de la empresa est\'a dada a trav\'es de
  89 una red p\'ublica X.25\cite{X25} que, como cualquier red p\'ublica de
  90 gran escala\cite{WAN}, tiende a tener problemas de estabilidad en los
  91 enlaces de forma considerablemente peri\'odica, por lo tanto el modelo
  92 m\'as adecuado ser\'a el asincr\'onico\cite{ASYNC} y habr\'a que tener en
  93 cuenta el particionamiento\cite{PART} de la red para minimizar el impacto
  94 en el sistema de la falta de conectividad, logrando una degradaci\'on
  95 gr\'acil\cite{DEGRAD}.
  96
  97 Adem\'as de la conectividad a nivel nacional a trav\'es de una red
  98 p\'ublica poco confiable, la empresa cuenta con LANs\cite{LAN} en
  99 cada provincia con un nivel de confiabilidad muy alto, por lo que,
 100 relacionado al particionamiento, proponemos la divisi\'on en sitios,
 101 con conglomerado de participantes en los sitios\cite{SITE}. De esta
 102 manera los participantes de un mismo sitio (o sitios con los que conserve
 103 conectividad) pueden seguir funcionando de forma aut\'onoma utilizando
 104 informaci\'on del stock local.
 105
 106 Para la comunicaci\'on entre los distintos participantes (ya
 107 sea en un mismo sitio o sitios externos) proponemos entonces un
 108 multicast\cite{MCAST}, de manera de que sea lo m\'as eficiente
 109 posible y circule la m\'inima cantidad posible de mensajes por la red
 110 p\'ublica que adem\'as tiene un costo por tr\'afico utilizado. Esto nos
 111 conduce al problema del direccionamiento y de la selecci\'on de un
 112 esquema de nombres\cite{NAMING} de participantes apropiado, para lo cual
 113 proponemos un sistema de resoluci\'on de nombres\cite{DNS} jer\'arquico
 114 y distribuido, para conservar la autonom\'ia local de cada sitio. Por
 115 estos mismos motivos proponemos que la autenticaci\'on y permisos de
 116 participantes en grupos utilicen un sistema an\'alogo de resoluci\'on.
 117
 118
 119 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 120 \section{Grupos}
 121
 122 El sistema actual requiere de distintos perfiles de usuarios. Hay usuarios
 123 que s\'olo pueden modificar cierto tipo de producto (y s\'olo agregar
 124 stock), hay otros que s\'olo pueden quitar stock, por ejemplo. Este
 125 esquema se ajusta bien a un esquema de grupos con un sistema de
 126 autorizaci\'on. M\'as espec\'ificamente este problema se ajusta a un
 127 modelo de grupos de diseminaci\'on\cite{GROUP.DISSE}.
 128
 129 Para que todos los participantes tengan una visi\'on global del sistema
 130 {\em precisa} y {\em consistente} es preciso contar con un servicio de
 131 membres\'ia que consista de grupos {\em visibles} (ya que los grupos
 132 son parte del problema y no s\'olo de la soluci\'on), una {\em vista}
 133 y un esquema de orden adecuado. Este problema se ajusta, adem\'as, a un
 134 modelo de grupos {\em cerrado} (porque s\'olo pueden enviar mensajes
 135 a un grupo los miembros de este, ya que deben estar autorizados para
 136 pertenecer al grupo y modificar el stock)\cite{GROUP.VIEW}.
 137
 138 Para todo esto es necesario tener el soporte de un protocolo de multicast
 139 para la comunicaci\'on de grupos.
 140
 141 \subsection{Autorizaci\'on}
 142 Para cumplir con los objetivos planteados, la soluci\'on que proponemos
 143 consiste en un esquema similar a la resoluci\'on de nombres\cite{DNS}
 144 ya que al ser un esquema distribuido asegura que no haya un punto \'unico
 145 de falla, localidad y eficiencia utilizando un {\em cache}.
 146
 147 \subsection{Orden}
 148 En principio notamos que un orden de tipo {\em FIFO}\cite{ORDER.FIFO}
 149 no es necesario (puesto que los Puntos de Venta y las F\'abricas
 150 ser\'an siempre participantes distintos). Sin embargo s\'i es
 151 necesario un orden de tipo causal\cite{ORDER.CAUSAL}, porque de
 152 otra forma podr\'ian quedar participantes con una vista del stock
 153 en negativo\cite{ORDER.FIFO.FAIL}. Tambi\'en es necesario un orden
 154 total\cite{ORDER.TOTAL} porque independientemente de la causalidad puede
 155 darse el caso anterior en otras circunstancias\cite{ORDER.CAUSAL.FAIL}.
 156
 157 \subsection{Multicast}
 158 Para poder implementar la comunicaci\'on de grupos es necesario
 159 tener un protocolo de {\em multicast} con las siguientes
 160 caracter\'isticas\cite{MCAST}:
 161 \begin{description}
 162   \item[Enrutamiento] Responsable de eligir la ruta del origen al
 163         destino.
 164   \item[Tolerancia a omisiones] Responsable de lidiar con mensajes
 165         perdidos o corruptos.
 166   \item[Control de flujo] Responsable de minimizar la p\'erdida de datos
 167         por la falta de espacio en buffers.
 168   \item[Ordenamiento] Responsable de asegurar que los mensajes lleguen
 169         en un orden dado por el criterio visto en la secci\'on previa.
 170   \item[Recuperaci\'on ante errores] Responsable de reforzar el criterio
 171         de ordenamiento y confiabilidad en relaci\'on al cambio de la
 172         vista.
 173 \end{description}
 174
 175 Esto es necesario para mantener la consistencia del sistema incluso
 176 ante fallas en la conectividad de la red p\'ublica. Si alguna de estas
 177 caracter\'isticas no estuviera presente, ser\'ia imposible asegurar esto.
 178
 179
 180 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 181 \section{Sitios}
 182
 183 El servicio de multicast debe atravesar varios sitios. Un sitio\cite{SITE}
 184 es una LAN dentro de la WAN de LANs\cite{WAN}. Es importante un buen
 185 manejo de sitios para evitar que el multicast atraviese redes que no
 186 es necesario atravesar y esto no es una buena idea si hay que atravesar
 187 una red p\'ublica que es lenta y que suele tener un costo por tr\'afico.
 188
 189 Para esto es necesario un mecanismo de detecci\'on de fallas de
 190 comunicaci\'on entre sitios y de membres\'ia, para saber qu\'e sitios
 191 est\'an activos.
 192
 193
 194 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 195 \subsection{Particionamiento}
 196
 197 Al estar dividido el sistema en sitios, separados por la red p\'ublica, es
 198 de esperarse que hayan problemas de conectividad entre los sitios. Esto
 199 es conocido como una partici\'on y aunque un esquema de partici\'on
 200 primaria\cite{PART} puede resultar una soluci\'on simple, para este caso
 201 creemos que es conveniente buscar un esquema m\'as adecuado.
 202
 203 Lo que proponemos es que, de acuerdo a los sitios activos que vea cada
 204 participante, se de un estado de stock {\em local} a esa partici\'on. De
 205 esta forma se puede seguir operando en todas las particiones (no
 206 s\'olo la primaria) aunque no se cuente con el estado del stock global
 207 (consigui\'endose una degradaci\'on gr\'acil\cite{DEGRAD}).
 208
 209 Al recuperarse la conectividad se puede reestablecer el stock global
 210 simplemente revisando la diferencia de los stocks locales antes de
 211 particionarse y enviandose esa diferencia entre las distintas particiones.
 212
 213
 214 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 215 \subsection{Asincron\'ia}
 216
 217 Al atravesar una red p\'ublica propensa a particiones, no se pueden dar
 218 garant\'ias de tiempo, s\'olo pueden darse garant\'ias de {\em liveness}
 219 (como, por ejemplo, se puede asegurar que "el mensaje llegar\'a
 220 eventualmente", pero no dar precisiones de cu\'ando), debi\'endose
 221 utilizar un modelo asincr\'onico\cite{ASYNC}.
 222
 223 Una desventaja de este modelo es que es muy dif\'icil diferenciar fallas
 224 de tiempos de respuesta muy largos, por lo que es necesario agregar un
 225 mecanismo de detecci\'on de fallas.
 226
 227
 228 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 229 \section{Esquema de nombres}
 230
 231 Para poder identificar a los distintos participantes de forma
 232 independiente de la arquitectura utilizada por el middleware, es necesario
 233 usar un esquema de nombre y por lo tanto un sistema de resoluci\'on
 234 de nombres\cite{DNS}.
 235
 236 Proponemos un esquema jer\'arquico como el utilizado por
 237 internet\cite{RFC1034}. Éste, si bien acarrea la utilizaci\'on de nombre
 238 impuros, es muy conveniente para el problema analizado, debido a que
 239 permite un correcto funcionamiento ante particiones (si hay al menos
 240 un servidor de nombres en cada partici\'on), aprovecha la local\'ia
 241 a trav\'es del uso de cache, proveyendo adem\'as redundancia ante
 242 fallas y es eficiente porque distribuye la carga de la resoluci\'on de
 243 nombres evitando que sea tanto un punto \'unico de falla como un cuello
 244 de botella.
 245
 246
 247 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 248 \section{Actividades}
 249
 250 Cualquier sistema distribuido est\'a compuesto por una combinaci\'on de 3
 251 clases de actividades primitivas\cite{ACTIV}: coordinar\cite{ACTIV.COORD},
 252 compartir\cite{ACTIV.SHARE} y replicar\cite{ACTIV.REPLI}.
 253
 254 Nuestra propuesta no es la excepci\'on, aunque se centra en s\'olo 2
 255 actividades principales, de las cuales es responsable el m\'odulo de
 256 administraci\'on de stock.
 257
 258 \subsection{Compartir}
 259 El sistema tiene que compartir una visi\'on global de stock. Para
 260 que el acceso a este recurso sea consistente es que se analizaron los
 261 requerimientos de orden, que aseguran que siempre que se modifique dicho
 262 stock, se haga de forma coherente.
 263
 264 \subsection{Replicar}
 265 Debido a la posibilidad de particiones propusimos un esquema de
 266 diseminaci\'on que permite que la informaci\'on de stock se replique en
 267 todos los sitios, de manera tal que ante problemas de conectividad cada
 268 sitio pueda seguir trabajando con su stock local. La consolidaci\'on ya
 269 se ha explicado que es simple, s\'olo hay que calcular la diferencia de
 270 stock que hubo en el tiempo sin conexi\'on.
 271
 272
 273 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 274 \section{Arquitectura general}
 275
 276 A continuaci\'on presentamos, de forma resumida, un esquema de la
 277 arquitectura general del sistema propuesta en base al an\'alisis realizado
 278 en las secciones anteriores.
 279
 280 \begin{figure}
 281 \begin{center}
 282 \includegraphics[width=3.0in]{arquitectura.eps}
 283 \caption{Arquitectura general del sistema}
 284 \label{arquitectura}
 285 \end{center}
 286 \end{figure}
 287
 288 Como se puede apreciar en la Figura \ref{arquitectura}, el sistema que
 289 proponemos est\'a basado en una arquitectura conocida\cite{GROUPARCH}
 290 que consiste en 2 capas principales: Participantes y Sitios. Cada capa
 291 est\'a compuesta por una serie de m\'odulos que pasaremos a describir
 292 brevemente a continuaci\'on.
 293
 294 \subsection{Detector de fallas de sitios}
 295 Este m\'odulo es responsable de la detecci\'on de fallas en la
 296 comunicaci\'on entre sitios, fundamental para proveer un servicio de
 297 membres\'ia de sitios para el manejo de particiones en caso de falla en
 298 el enlace de la red p\'ublica.
 299
 300 \subsection{Multicast de red}
 301 El m\'odulo de multicast de red provee comunicaci\'on {\em multi-peer}
 302 no confiable a nivel de capa de red (como podr\'ia ser el servicio
 303 de multicast que provee IP) como mecanismo b\'asico para el pasaje
 304 de mensajes entre los nodos del sistema.  Este m\'odulo utiliza el
 305 Detector de fallas de sitios para propagar los mensajes s\'olo a los
 306 sitios activos.
 307
 308 \subsection{Comunicaci\'on de grupos}
 309 Este m\'odulo es el encargado de agregar confiabilidad y orden a la
 310 comunicaci\'on multicast para cumplir con la sem\'antica y restricciones
 311 a nivel de grupos, proveyendo una comunicaci\'on entre participantes
 312 adecuada para garantizar los requerimientos del sistema.
 313
 314 \subsection{Membres\'ia de sitios}
 315 Este m\'odulo es el encargado de proveer informaci\'on sobre la
 316 membres\'ia de los sitios participantes (activos) de los grupos, de manera
 317 que el servicio de multicast no disemine mensajes en sitios inactivos.
 318
 319 \subsection{Detector de fallas de participantes}
 320 Es an\'alogo al detector de fallas de sitios pero a nivel de
 321 participantes. Informa a otros m\'odulos cuando se suma o se retira
 322 un participante.
 323
 324 \subsection{Autorizaci\'on de participantes}
 325 Este m\'odulo usa un modelo similar a la resoluci\'on de nombres\cite{DNS}
 326 para proveer informaci\'on sobre los grupos a los que puede asociarse un
 327 participante. La estructura jer\'arquica distribuida permite aprovechar
 328 la localidad en caso de particionamiento.
 329
 330 \subsection{Membres\'ia de participantes}
 331 Provee informaci\'on de membres\'ia a nivel de participantes, la vista
 332 \cite{VISTA}. Utiliza el detector de fallas de participantes y membres\'ia
 333 de sitios para saber qu\'e participantes est\'an activos.
 334
 335 \subsection{Administraci\'on de stock}
 336 Este m\'odulo es el que se encarga de, en base a la informaci\'on que
 337 provee la membres\'ia de sitios y participantes, dar una vista de la
 338 informaci\'on de stock del sistema, seg\'un la conectividad disponible
 339 como as\'i administrar las actividades distribuidas\cite{ACTIV}.
 340
 341 \subsection{Participantes}
 342 Son las entidades del sistema: F\'abricas y Puntos de Venta. Son los
 343 verdaderos usuarios del middleware. Se comunican s\'olamente con el
 344 m\'odulo de Administraci\'on de stock quien los abstrae del resto de
 345 la arquitectura del sistema, proveyendo una interfaz simple para que
 346 los programadores de la aplicaci\'on no deban lidiar con los problemas
 347 complejos del sistema distribuido.
 348
 349
 350 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 351 \section{Conclusiones}
 352
 353 Dados los requerimientos del modelo de negocio, y el costo de la
 354 utilizaci\'on de la red p\'ublica, el modelo planteado impone una
 355 soluci\'on \'optima para garantizar el bajo costo en las comunicaciones,
 356 como tambi\'en as\'i dar garant\'ias de consitencia en la informaci\'on
 357 manejada por los sistemas clientes que utilizan el middleware.
 358
 359 Un esquema de trabajo como el planteado ayudar\'a a mejorar la
 360 integraci\'on de los diferentes grupos dentro del sistema y garantizar
 361 una correcta escalabilidad del sistema a largo plazo, pudiendo integrar
 362 nuevos grupos o nuevos clientes a los grupos existentes en la actualidad.
 363
 364 Tambi\'en se consigue mejorar la tolerancia a fallas y la disponibilidad
 365 del sistema, consiguiendo una degradaci\'on gr\'acil ante particiones
 366 a diferencia de la soluci\'on actual que deja inoperable al sistema
 367 por completo.
 368
 369
 370 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 371 \section{Referencias}
 372 \bibliography{tp_mom}
 373 \bibliographystyle{is-unsrt}
 374
 375 \end{document}
 376
 377 % vim: set tw=74 :