]> git.llucax.com Git - z.facultad/75.31/presentacion.git/blob - presentacion_d.lyx
Mejoras.
[z.facultad/75.31/presentacion.git] / presentacion_d.lyx
1 #LyX 1.3 created this file. For more info see http://www.lyx.org/
2 \lyxformat 221
3 \textclass article
4 \language spanish
5 \inputencoding latin1
6 \fontscheme palatino
7 \graphics default
8 \paperfontsize default
9 \spacing single 
10 \papersize a4paper
11 \paperpackage widemarginsa4
12 \use_geometry 0
13 \use_amsmath 0
14 \use_natbib 0
15 \use_numerical_citations 0
16 \paperorientation portrait
17 \secnumdepth 3
18 \tocdepth 3
19 \paragraph_separation indent
20 \defskip medskip
21 \quotes_language english
22 \quotes_times 2
23 \papercolumns 1
24 \papersides 1
25 \paperpagestyle default
26
27 \layout Title
28
29 Teoría de Lenguaje
30 \newline 
31 Lenguaje D
32 \layout Author
33
34 Leandro Lucarella (77891)
35 \layout Date
36
37 30 de Mayo de 2005
38 \layout Standard
39
40
41 \begin_inset LatexCommand \tableofcontents{}
42
43 \end_inset 
44
45
46 \layout Section
47
48 Introducción
49 \layout Standard
50
51 El lenguaje de programación D fue concebido en el año 1999 como una re-ingenierí
52 a de C y C++ y siguen en la actualidad sin estar completamente definido
53  y con algunas cosas sin implementar.
54  Este lenguaje es compilado y de alto rendimiento pero con un nivel un poco
55  más alto que C o C++ (pero sin sacrificar la posibilidad de hacer cosas
56  de bajo nivel y muy eficientes).
57  D es compatible binariamente con C, pero 
58 \series bold 
59 no
60 \series default 
61  con C++.
62 \layout Standard
63
64 Uno de los principales objetivos de D es ser un lenguaje de programación
65  multi-paradigma, poniendo mucho énfasis en la practicidad (no pretende
66  ser un lenguaje académico estrictamente atado a un paradigma en particular).
67  También pone mucho énfasis en la programación segura (a pesar de dejar
68  bajar a un nivel muy bajo, al punto de poder embeber assembly, tiene muchas
69  herramientas para detectar y evitar errores).
70 \layout Subsection
71
72
73 \begin_inset LatexCommand \label{sub:Objetivo-del-lenguaje}
74
75 \end_inset 
76
77 Objetivo del lenguaje
78 \layout Standard
79
80 D, oficialmente, tiene los siguientes objetivos:
81 \layout Itemize
82
83 Reducir el costo de desarrollo en al menos un 10% agregando características
84  que mejoren la productividad y ajustando las características del lenguaje
85  para que los errores más comunes que más cuestan reparar sean evitados
86  de base.
87 \layout Itemize
88
89 Hacer más fácil escribir programas portables entre compiladores, arquitecturas
90  y sistemas operativos.
91 \layout Itemize
92
93 Soportar programación multi-paradigma; es decir, como mínimo, soportar los
94  paradigmas: imperativo, estructurado, orientado a objetos y programación
95  genérica.
96 \layout Itemize
97
98 Tener una curva de aprendizaje corta para programadores que se sienten a
99  gusto con C o C++.
100 \layout Itemize
101
102 Proveer acceso irrestricto de bajo nivel cuando sea necesario.
103 \layout Itemize
104
105 Hacer que implementar un compilador sea mucho más sencillo que para C++.
106 \layout Itemize
107
108 Ser compatible con la ABI
109 \begin_inset Foot
110 collapsed false
111
112 \layout Standard
113
114 Application Binary Interface, i.e.
115  mantener compatibilidad a nivel de código objeto con C.
116 \end_inset 
117
118  local de C.
119 \layout Itemize
120
121 Tener gramática libre de contexto.
122 \layout Itemize
123
124 Escribir fácilmente aplicaciones internacionalizadas.
125 \layout Itemize
126
127 Incorporar Programación por Contrato y metodologías de casos de prueba.
128 \layout Itemize
129
130 Ser capaz de construir programas independientes y livianos.
131 \layout Section
132
133 Sistema de tipos
134 \layout Subsection
135
136 Tipos básicos
137 \layout Standard
138
139 D tiene una gran variedad de tipos básicos, ya que, además de poseer todos
140  los tipos básicos para poder desarrollar a bajo nivel como en C, dispone
141  de números complejos y otros tipos no tan comunes.
142 \layout Standard
143
144 Entre los tipos compatibles con C se encuentra:
145 \layout Description
146
147 Vacío 
148 \family typewriter 
149 void
150 \layout Description
151
152 Signados 
153 \family typewriter 
154 char wchar byte short int long
155 \layout Description
156
157 No\SpecialChar ~
158 signados 
159 \family typewriter 
160 char wchar ubyte ushort uint ulong
161 \layout Description
162
163 Punto\SpecialChar ~
164 flotante 
165 \family typewriter 
166 float double
167 \layout Standard
168
169
170 \family typewriter 
171 char
172 \family default 
173  y 
174 \family typewriter 
175 wchar
176 \family default 
177  no tienen su contraparte signada, ya que son para uso explícito de variables
178  de caracter (UTF-8 y UTF-16 respectivamente).
179  Además agrega algunos nuevos tipos: 
180 \family typewriter 
181 bit
182 \family default 
183  (análogo a 
184 \family typewriter 
185 bool
186 \family default 
187  de C++), 
188 \family typewriter 
189 cent
190 \family default 
191  y 
192 \family typewriter 
193 ucent
194 \family default 
195  (128 bits, reservado para uso futuro); 
196 \family typewriter 
197 real
198 \family default 
199  (tipo de punto flotante más grande representable por la arquitectura, en
200  Intel es de 80 bits) y 
201 \family typewriter 
202 dchar
203 \family default 
204  (UTF-32).
205 \layout Standard
206
207 Finalmente agrega el tipo básico imaginario, cuyos tipos son iguales que
208  los 
209 \emph on 
210 racionales
211 \emph default 
212  (de punto flotante) pero anteponiendo una 
213 \family typewriter 
214 i
215 \family default 
216
217 \family typewriter 
218 ifloat idouble ireal
219 \family default 
220 .
221  Combinando 
222 \emph on 
223 racionales
224 \emph default 
225  con imaginarios se pueden forma complejos, cuyos variaciones son de la
226  misma forma, sólo que se antepone una 
227 \family typewriter 
228 c
229 \family default 
230  en vez de una 
231 \family typewriter 
232 i
233 \family default 
234 :
235 \family typewriter 
236  cfloat cdouble creal
237 \family default 
238 .
239 \layout Subsection
240
241
242 \begin_inset LatexCommand \label{sub:Tipos-derivados}
243
244 \end_inset 
245
246 Tipos derivados
247 \layout Standard
248
249 De los tipos básicos pueden derivarse otros tipos.
250  Esto tipos son punteros, array (estáticos, dinámicos y asociativos) y funciones
251 , siendo estas últimas tal vez un caso muy particular.
252  Los array tal vez podrían considerarse tipos compuestos, pero como la variable
253  en sí es un puntero, en realidad no lo es.
254  Es decir, para obtener un elemento del array hay que aplicar aritmética
255  de punteros, ya sea 
256 \emph on 
257 explícitamente
258 \emph default 
259  o 
260 \emph on 
261 implícitamente
262 \emph default 
263  utilizando el operador corchetes.
264 \layout LyX-Code
265
266 char[] str = 
267 \begin_inset Quotes eld
268 \end_inset 
269
270 hola
271 \begin_inset Quotes erd
272 \end_inset 
273
274 ; // Array dinámico de caracteres
275 \layout LyX-Code
276
277 str = 
278 \begin_inset Quotes eld
279 \end_inset 
280
281 hola todos
282 \begin_inset Quotes erd
283 \end_inset 
284
285 ;  // Se autoredimensiona
286 \layout LyX-Code
287
288 int[2] arr;            // Array (estático) de 2 int
289 \layout LyX-Code
290
291 int[char[]] hash;      // Array asociativo de int cuya clave es un char[]
292 \layout LyX-Code
293
294 void function() fp;    // Puntero a una función void (void)
295 \layout LyX-Code
296
297 int function(bit) fp2; // Puntero a una función int (bit)
298 \layout LyX-Code
299
300 int delegate(bit) del; // Delegado de tipo int (bit)
301 \layout Standard
302
303 Los delegados son algo así como punteros a función con contexto.
304  El contexto puede ser tanto un objeto como un 
305 \emph on 
306 frame pointer
307 \emph default 
308  (el puntero al stack en donde se encuentra el padre lexicográfico de una
309  función anidada).
310  Veremos un poco más los delegados en la sección 
311 \begin_inset LatexCommand \vref{sub:Operaciones}
312
313 \end_inset 
314
315  y en la 
316 \begin_inset LatexCommand \vref{sub:Rutinas}
317
318 \end_inset 
319
320 .
321 \layout Subsection
322
323 Tipos de usuario
324 \layout Standard
325
326 D dispone de varias formas de definir tipos de usuario, entre ellos varios
327  que provienen de C.
328  Veamos cada uno.
329 \layout Subsubsection
330
331 alias
332 \layout Standard
333
334 Un alias es la forma más primitiva de tipo de usuario, simplemente es otra
335  forma de escribir un tipo ya definido (es análogo al typedef de C).
336  Ejemplo:
337 \layout LyX-Code
338
339 alias int tipo;
340 \layout LyX-Code
341
342 int i = 1;
343 \layout LyX-Code
344
345 tipo t = i; // Correcto (semánticamente son los dos int)
346 \layout Standard
347
348 A partir de ahora puedo hacer referencia a 
349 \family typewriter 
350 int
351 \family default 
352  llamándolo 
353 \family typewriter 
354 tipo
355 \family default 
356 .
357  Es decir, son semánticamente idénticos.
358 \layout Subsubsection
359
360 typedef
361 \layout Standard
362
363 typedef es similar al alias, con la salvedad de que define un tipo semánticament
364 e distinto (por más que la estructura en memoria y la forma de manejarlo
365  sea idéntica).
366  Como consecuencia de esto, se efectúa chequeo de tipos y, por ejemplo,
367  no puedo asignar a una variable de un tipo que es un typedef de otro:
368 \layout LyX-Code
369
370 typedef int tipo;
371 \layout LyX-Code
372
373 int i = 1;
374 \layout LyX-Code
375
376 // No compila porque se está asignando un int a un tipo
377 \layout LyX-Code
378
379 // tipo t = i;
380 \layout LyX-Code
381
382 tipo t = cast(tipo)(i); // Correcto (conversión explícita)
383 \layout Subsubsection
384
385 enum
386 \layout Standard
387
388 Enum es en realidad un 
389 \family typewriter 
390 int
391 \family default 
392  que puede tener sólo un número predefinido de valores, que además son represent
393 ados simbólicamente.
394 \layout LyX-Code
395
396 enum Dias { DOMINGO, LUNES, MARTES, MIERCOLES, JUEVES, VIERNES, SABADO }
397 \layout LyX-Code
398
399 Dias d = Dias.MARTES;
400 \layout Subsubsection
401
402 union
403 \layout Standard
404
405 Union es otro tipo de dato definido por el usuario proveniente de C, que
406  permite ver una misma 
407 \emph on 
408 celda
409 \emph default 
410  de memoria de distintas formas.
411 \layout LyX-Code
412
413 union Celda
414 \layout LyX-Code
415
416 {
417 \layout LyX-Code
418
419     int i;
420 \layout LyX-Code
421
422     real r;
423 \layout LyX-Code
424
425 }
426 \layout LyX-Code
427
428 Celda c;
429 \layout LyX-Code
430
431 c.i = 1;
432 \layout LyX-Code
433
434 c.r += 2.5;
435 \layout Standard
436
437 Tanto 
438 \family typewriter 
439 r
440 \family default 
441  como 
442 \family typewriter 
443 i
444 \family default 
445  se guarda en la misma celda de memoria, por lo que se utilizan como mecanismos
446  alternativos para operar en ella, usando semántica de uno u otro tipo.
447  Esto es particularmente útil para aplicaciones de bajo nivel, donde el
448  espacio en memoria es muy reducido.
449  Esta técnica permite tener una variable cuyo tipo es, en cierto modo, variable.
450 \layout Subsubsection
451
452 struct
453 \layout Standard
454
455 El struct es muy similar al de C, con algunos agregados, como la posibilidad
456  de tener funciones miembro, inicializadores, etc.
457  No es más que el agrupamiento de un conjunto de variables, a las que se
458  accede a través de un identificador:
459 \layout LyX-Code
460
461 struct Fecha
462 \layout LyX-Code
463
464
465 \layout LyX-Code
466
467     uint dia = 1;
468 \layout LyX-Code
469
470     uint mes = 1;
471 \layout LyX-Code
472
473     uint anio = 2005;
474 \layout LyX-Code
475
476     void print()
477 \layout LyX-Code
478
479     {
480 \layout LyX-Code
481
482         printf("dia: %d, mes: %d, anio: %d
483 \backslash 
484 n", dia, mes, anio);
485 \layout LyX-Code
486
487     }
488 \layout LyX-Code
489
490 }
491 \layout LyX-Code
492
493 Fecha f;
494 \layout LyX-Code
495
496 f.dia = 30;
497 \layout LyX-Code
498
499 f.mes = 5;
500 \layout LyX-Code
501
502 f.print();
503 \layout Subsubsection
504
505
506 \begin_inset LatexCommand \label{sub:tipo-class}
507
508 \end_inset 
509
510 class
511 \layout Standard
512
513 Las clases son la forma en la que D implementa la orientación a objetos,
514  que veremos en detalle más adelante.
515  Por ahora sólo adelantaremos que es muy similar a un struct, sólo que guarda
516  algo más de información de control (como la tabla virtual) para poder implement
517 ar polimorfismo y herencia.
518 \layout Subsubsection
519
520 interface
521 \layout Standard
522
523 Las interfaces son un caso particular de clases, que no puede tener atributos,
524  sólo métodos.
525  Una clase puede implementar varias interfaces, por lo que esto no e es
526  más que una forma limitada de implementar herencia múltiple, eliminando
527  el problema de la representación en memoria de los datos.
528 \layout Section
529
530 Expresiones
531 \layout Subsection
532
533
534 \begin_inset LatexCommand \label{sub:Operaciones}
535
536 \end_inset 
537
538 Operaciones
539 \layout Standard
540
541 D provee las operaciones básicas que provee prácticamente cualquier lenguaje:
542  asignación, comparación, incremento, decremento, suma, resta, multiplicación,
543  división, resto, álgebra booleana (and, or, xor, not), shifting.
544 \layout LyX-Code
545
546 int i = 1 << 1; // 0001b << 1 == 0010b == 2
547 \layout LyX-Code
548
549 int j = i >> 1; // 2 >> 1 == 0010b >> 1 == 0001b == 1
550 \layout LyX-Code
551
552 i -= j;         // i = i - j = 2 - 1 = 1
553 \layout LyX-Code
554
555 i = -i;         // i = -1
556 \layout LyX-Code
557
558 i *= 4;         // i = i * 4 = -1 * 4 = -4
559 \layout LyX-Code
560
561 i >>>= 1;       // i = i >>> 1 = 1100b >>> 1 = 1110b = -2
562 \layout LyX-Code
563
564 i++;            // i = i + 1 = -2 + 1 = -1
565 \layout LyX-Code
566
567 i |= j;         // i = i | j = 1111b | 0001b = 1111b = -1
568 \layout LyX-Code
569
570 i &= j;         // i = i & j = 1111b & 0001b = 0001b = 1
571 \layout LyX-Code
572
573 bit c = i > j;  // c = 1 > 1 = false
574 \layout LyX-Code
575
576 c = i && j;     // c = 1 && 1 = true
577 \layout LyX-Code
578
579 i = 3 / 2;      // i = 3 / 2 = 1 (entero)
580 \layout LyX-Code
581
582 i = 3 % 2;      // i = resto(3/2) = 1
583 \layout Standard
584
585 También provee llamadas a funciones y delegados.
586 \layout LyX-Code
587
588 printf(
589 \begin_inset Quotes eld
590 \end_inset 
591
592 Hola mundo
593 \backslash 
594 n
595 \begin_inset Quotes erd
596 \end_inset 
597
598 );  // Llama a void printf(char*, ...)
599 \layout LyX-Code
600
601 bit ok = esta_ok(10, 1.5); // Llama a bit esta_ok(int, float)
602 \layout LyX-Code
603
604 int n = objeto.cantidad(); // Llama a int Clase::cantidad(Clase)
605 \layout LyX-Code
606
607 int delegate(void) delegado;
608 \layout LyX-Code
609
610 delegado = &objeto.cantidad;
611 \layout LyX-Code
612
613 n = delegado();            // Llama a objeto.cantidad()
614 \layout Standard
615
616 Además de esto, provee operaciones propias de un lenguaje imperativo de
617  bajo nivel: aritmética de punteros, operador [] como método alternativo
618  para acceder a una posición de un array, desreferenciamiento, obtención
619  de una dirección de memoria de una variable, etc.
620 \layout LyX-Code
621
622 int[2] arr;
623 \layout LyX-Code
624
625 arr[1] = 1; // asigno el segundo elemento (empieza en 0)
626 \layout LyX-Code
627
628 int* p = cast(int*) arr + 1; // apunto a arr[1]
629 \layout LyX-Code
630
631 *p = 2; // arr[1] = 2
632 \layout LyX-Code
633
634 *(--p) = 1; // p apunta a arr[0] y arr[0] = 1
635 \layout LyX-Code
636
637 p = &(arr[1]); // p apunta a arr[1]
638 \layout Standard
639
640 También incluye un operador para comparar si 2 referencias referencian al
641  mismo objeto.
642 \layout LyX-Code
643
644 class C { int i = 0; int opEquals(C o) { return i == o.i; } }
645 \layout LyX-Code
646
647 C c1 = new C;
648 \layout LyX-Code
649
650 C c2 = new C;
651 \layout LyX-Code
652
653 C c3 = c1;
654 \layout LyX-Code
655
656 c1.i = c2.i = 1;
657 \layout LyX-Code
658
659 c1 is c2; // false
660 \layout LyX-Code
661
662 c1 is c3; // true
663 \layout LyX-Code
664
665 c1 == c2; // true
666 \layout Standard
667
668 y algunas operaciones propias de los arrays y hashes (array asociativos),
669  como para saber si existe una clave o concatenación y slicing de arrays.
670 \layout LyX-Code
671
672 int[3] arr;
673 \layout LyX-Code
674
675 arr[1] = 10;
676 \layout LyX-Code
677
678 int[2] arr2;
679 \layout LyX-Code
680
681 arr2[1] = 1;
682 \layout LyX-Code
683
684 arr3 = arr ~ arr2; // arr3 = (0,10,0,0,1)
685 \layout LyX-Code
686
687 int[float] hash;
688 \layout LyX-Code
689
690 hash[1.1] = 1;
691 \layout LyX-Code
692
693 1.0 in hash; // false
694 \layout LyX-Code
695
696 1.1 in hash; // true
697 \layout Standard
698
699 Finalmente provee un operador de resolución de scope, para acceder a variables
700  definidas dentro de tipos compuestos (como estructuras o uniones) o módulos.
701 \layout Subsection
702
703
704 \begin_inset LatexCommand \label{sub:Variables}
705
706 \end_inset 
707
708 Variables
709 \layout Standard
710
711 El lenguaje provee variables sin nombre a través de punteros y alocación
712  manual de memoria.
713  En general las instancias de clases son referencias (no puede ser alocadas
714  en el stack, en principio), por lo que podría decirse que toda instancia
715  de clase es una variable sin nombre.
716  Para alocar memoria se puede usar el operador 
717 \family typewriter 
718 new
719 \family default 
720  que aloca memoria 
721 \emph on 
722 vigilada
723 \emph default 
724  por el recolector de basura, o a través de la llamada al malloc de C (en
725  el módulo 
726 \family typewriter 
727 std.c.stdlib
728 \family default 
729  en D), que aloca memoria no 
730 \emph on 
731 vigilada
732 \emph default 
733  por el recolector.
734  El manejo de referencias es automático, no hay forma de declarar una variable
735  de tipo referencia.
736  Si la variable es de tipo clase, será una referencia, si no no (con algunas
737  excepciones, como al pasarse por parámetro).
738  Si se desean usar variables sin nombre que no sean clases, hay que usar
739  punteros.
740 \layout LyX-Code
741
742 import std.c.stdlib;
743 \layout LyX-Code
744
745 int* p = cast(int*) malloc(4 * int.sizeof); // Nunca serán recolectados
746 \layout LyX-Code
747
748 p[3] = 1;
749 \layout LyX-Code
750
751 free(p); // Lo libero yo
752 \layout Subsection
753
754 Representación de la memoria
755 \layout Standard
756
757 La representación en memoria es muy similar a cualquier lenguaje imperativo
758  compilado, como C o C++.
759  Cada tipo de variable ocupa una cierta cantidad de bytes y se almacenan
760  en memoria de forma contigua (al menos lógicamente), según la alineación
761  de la arquitectura para la que fue compilado.
762  Esto trae el clásico problema de los 
763 \emph on 
764 huecos
765 \emph default 
766  que pueden quedar, para que cada variable ocupe un múltiplo de palabras
767  de la arquitectura, para manejarla con mayor eficiencia, por lo que el
768  compilador provee formas de especificar la alineación a usar.
769 \layout Standard
770
771 Las variables globales (que incluye a las estáticas) se almacenan en tiempo
772  de compilación (estáticamente) dentro del código del programa, en el área
773  de datos.
774  Las variables locales a las funciones se almacenan en una pila de ejecución,
775  por lo tanto debe tener una pila por cada hilo de ejecución.
776  Por último hay un área de memoria 
777 \emph on 
778 libre
779 \emph default 
780  que se le pide al sistema operativo a medida que se necesita (heap).
781  Una particularidad extra de D es que los tipos definidos por el usuario
782  de tipo 
783 \series bold 
784 class
785 \series default 
786 , se almacenan en el heap.
787  En el stack y en el área de datos del programa sólo pueden guardarse referencia
788 s (punteros) a instancias de una clase (en realidad hay excepciones, ya
789  que se puede pedir memoria del stack 
790 \emph on 
791 a mano
792 \emph default 
793  e inicializar el objeto en esa memoria, pero no es el caso general).
794 \layout Standard
795
796 Como dijimos, los tipos simples ocupan una cantidad de memoria fija cada
797  uno.
798  Cada tipo derivado tiene sus propias particularidades.
799 \layout Subsubsection
800
801 array estático
802 \layout Standard
803
804 El array estático no es más que una región contigua de bytes de tamaño N*S,
805  siendo N la cantidad de elementos y S el tamaño que ocupa el elemento.
806  Una variable de este tipo, entonces, no es más que un puntero al primer
807  elemento.
808 \layout Subsubsection
809
810 array dinámico
811 \layout Standard
812
813 Los array dinámicos, como su nombre lo indica, no tienen un tamaño fijo,
814  por lo tanto se guarda el tamaño además de los elementos en sí.
815  Una variable de este tipo es entonces un indicador de la cantidad actual
816  de elementos y un puntero al primer elemento.
817  Es por esto que típicamente este tipo de array ocupa 8 bytes (4 bytes para
818  almacenar N y 4 bytes para almacenar el puntero al primer elemento, que
819  se establecen en tiempo de ejecución) más los N*S para los elementos en
820  sí.
821 \layout Subsubsection
822
823 array asociativo (o hash)
824 \layout Standard
825
826 La representación de este tipo de array no está aún definida, aunque al
827  igual que los array dinámico dice que la referencia ocupa 8 bytes, pero
828  no indica para que sirve cada byte, aunque es esperable que sea igual,
829  4 bytes para la cantidad de memoria alocada para la tabla de hash y 4 para
830  el puntero a la tabla en sí.
831 \layout Subsubsection
832
833 enum
834 \layout Standard
835
836 No es más que un int con un rango de valores posibles predefinidos y con
837  nombres simbólicos, por lo que simplemente se almacena como un int y todos
838  los chequeos se realizan en tiempo de compilación.
839 \layout Subsubsection
840
841 union
842 \layout Standard
843
844 Las uniones ocupan en memoria, como mínimo, la misma la cantidad de bytes
845  que ocupa su elemento de mayor tamaño.
846  Como el tipo que se está usando para acceder se sabe en tiempo de compilación,
847  no es necesario almacenar datos extra, pero podría ocupar más lugar si
848  el compilador hiciera alguna optimización (para que ocupe múltiplos de
849  una palabra, por ejemplo).
850 \layout Subsubsection
851
852 struct
853 \layout Standard
854
855 Las estructuras, al igual que en C, se almacenan de forma continua ocupando,
856  como mínimo, 
857 \begin_inset Formula $\sum S_{i}$
858 \end_inset 
859
860  siendo 
861 \begin_inset Formula $S_{i}$
862 \end_inset 
863
864  el tamaño del elemento i del struct.
865  Nuevamente, los tamaños se conocen en tiempo de compilación por lo que
866  no es necesario guardar datos extra y ocupando más eventualmente si el
867  compilador optimiza.
868 \layout Subsubsection
869
870
871 \begin_inset LatexCommand \label{sub:repr-class}
872
873 \end_inset 
874
875 class
876 \layout Standard
877
878 Las clases son seguramente las estructuras más complejas.
879  Basadas en las estructuras, le agregan datos de control para implementar
880  herencia y polimorfismo.
881  Para esto debe almacenarse, además de los elementos (no estáticos, o sea
882  de instancia) como en el struct, un puntero a una tabla virtual (vtable)
883  y un monitor, ocupando 4 bytes cada uno.
884  El monitor no está bien especificado para qué sirve, pero supongo que debe
885  estar relacionado al recolector de basura.
886  La tabla virtual, a su vez, está compuesta por un puntero a la instancia
887  de una clase ClassInfo (que guarda datos de la clase en sí) y por todos
888  los punteros a métodos virtuales (para implementar polimorfismo).
889  Los atributos estáticos (de clase), como ya se mencionó, se almacenan como
890  variables globales, ya que se conocen en tiempo de compilación.
891 \layout Subsubsection
892
893 function
894 \layout Standard
895
896 Los punteros a funciones se almacenan como un puntero común y corriente,
897  ya que la 
898 \emph on 
899 firma
900 \emph default 
901  de la función se conoce en tiempo de compilación y se sabe la cantidad
902  de datos que se deben apilar y desapilar al hacer el llamado, por lo que
903  todo ese código puede hacerse en tiempo de compilación independientemente
904  de donde se encuentre el código de la función a ejecutar.
905 \layout Subsubsection
906
907 delegate
908 \layout Standard
909
910 Los delegados deben tener la información del contexto, es por esto que ocupan
911  8 bytes (en x86), 4 para el puntero al código de la función y 4 para el
912  puntero al contexto (sea una instancia de clase o un 
913 \emph on 
914 frame pointer
915 \emph default 
916 ).
917  Esto se comprobó empíricamente ya que no está definido aún.
918 \layout Subsection
919
920 Modelo de ejecución
921 \layout Standard
922
923 D es un lenguaje imperativo compilado, por lo que se basa en el modelo de
924  Von-Newman y sus 3 operaciones básicas:
925 \layout Enumerate
926
927 Fetch
928 \layout Enumerate
929
930 Incrementar IP
931 \layout Enumerate
932
933 Ejecutar instrucción
934 \layout Standard
935
936 El llamado a funciones se hace a través de la pila, ya que soporta recursión
937  y hay una pila por cada hilo, ya que soporta múltiples hilos.
938  Además de la cadena dinámica (para el llamado recursivo) tiene cadena estática,
939  ya que soporta funciones anidadas, con el modelo estático, que busca las
940  variables en el 
941 \emph on 
942 padre estructural
943 \emph default 
944  de la función y no en la función apilada inmediatamente arriba.
945 \layout Subsection
946
947
948 \begin_inset LatexCommand \label{sub:Punteros}
949
950 \end_inset 
951
952 Punteros
953 \layout Standard
954
955 Este lenguaje soporta punteros y referencias, aunque estas últimas son implícita
956 s (el compilador decide cuando usar una referencia y cuando una copia).
957  En términos generales, las instancias de clase siempre se referencian a
958  través de una referencia (jamás se copia un objeto implícitamente).
959  Como se explicó en la sección 
960 \begin_inset LatexCommand \vref{sub:Operaciones}
961
962 \end_inset 
963
964 , se proveen operaciones para tomar la dirección de una variable (su 
965 \emph on 
966 almacén
967 \emph default 
968 ) y desreferenciamiento y aritmética de punteros.
969  Además se pueden convertir punteros de forma implícita siguiendo algunas
970  reglas.
971  Por ejemplo cualquier puntero puede ser convertido implícitamente a un
972  puntero a 
973 \emph on 
974 void
975 \emph default 
976  (sin tipo) o a un puntero a una clase ancestro (si es una instancia de
977  clase).
978  También se ha dicho que, al igual que en C, hay una relación muy estrecha
979  entre puntero y array, por lo que cualquier array puede ser convertido
980  implícitamente a un puntero.
981 \layout Subsection
982
983
984 \begin_inset LatexCommand \label{sub:Recolección-de-basura}
985
986 \end_inset 
987
988 Recolección de basura
989 \layout Standard
990
991 D provee un recolector de basura, aunque aún no hay muchas definiciones
992  con respecto a su tipo.
993  Por el tipo de API que se provee para controlar el recolector de basura,
994  parece ser del tipo 
995 \emph on 
996 mark-sweep
997 \emph default 
998  o 
999 \emph on 
1000 copy collection
1001 \emph default 
1002  ya que se proveen funciones para agregar raíces y también parece implementar
1003  algún tipo de algoritmo generacional ya que además de proveer un método
1004  para realizar una recolección completa, provee uno para realizar una recolecció
1005 n generacional.
1006 \layout Standard
1007
1008 Aunque no parece haber nada definido aún con respecto al recolector de basura
1009  (más que estudiar empíricamente la implementación actual o basarse en lo
1010  que provee la biblioteca estándar para manipular al recolector), se menciona
1011  en varios lugares que el ciclo de colección sólo puede ser lanzado cuando
1012  se intenta alocar nueva memoria.
1013  Es decir, que se puede confiar en que el recolector no va a interrumpir
1014  la ejecución del programa en un fragmento de código en el que no se aloca
1015  memoria.
1016  De cualquier manera, la biblioteca estándar también provee métodos para
1017  desactivar momentáneamente al recolector, por si hay partes críticas del
1018  programa que no deban ser interrumpidas.
1019 \layout Standard
1020
1021 Además se menciona que el ciclo de recolección debe correr solo; es decir,
1022  que mientras corre el ciclo de recolección no puede haber ningún otro hilo
1023  del programa corriendo al mismo tiempo (cosa que tiene mucho sentido, de
1024  otra forma sería virtualmente imposible seguir el rastro de la memoria).
1025 \layout Subsubsection
1026
1027 Casos límite
1028 \layout Standard
1029
1030 D se enfrenta a un problema poco común en la recolección de basura, ya que
1031  la mayor parte de los lenguajes que lo implementan no permiten un manejo
1032  de bajo nivel de la memoria.
1033  Hay varias circunstancias en las cuales el recolector de basura de D puede
1034  fallar.
1035  Veamos algunos casos:
1036 \layout LyX-Code
1037
1038 void* p;
1039 \layout LyX-Code
1040
1041 ...
1042 \layout LyX-Code
1043
1044 int x = cast(int)p;
1045 \layout Standard
1046
1047 En este caso, el comportamiento es indefinido ya que el recolector no verifica
1048  raíces que no sean punteros.
1049  Otro caso:
1050 \layout LyX-Code
1051
1052 void* p = cast(void*)12345678;
1053 \layout Standard
1054
1055 Si por casualidad la dirección de memoria está siendo manejada por el recolector
1056  de basura, estamos ante un problema.
1057  Otros caso que podrían resultar un tanto confuso es que no se puede confiar
1058  en que un puntero conserve la dirección a la que apunta de forma invariante,
1059  ya que el recolector de basura puede moverlo.
1060  Por lo tanto un código como el siguiente:
1061 \layout LyX-Code
1062
1063 int* p1, p2;
1064 \layout LyX-Code
1065
1066 ...
1067 \layout LyX-Code
1068
1069 if (p1 < p2) ...;
1070 \layout Standard
1071
1072 tiene un comportamiento aleatorio.
1073  Y esto sólo por nombrar algunos problemas que puede acarrear el manejo
1074  de bajo nivel de la memoria usando un recolector de basura.
1075  Claro que si uno necesita un manejo de tan bajo nivel, para estos casos
1076  se puede usar memoria no administrada por el recolector.
1077 \layout Subsection
1078
1079
1080 \begin_inset LatexCommand \label{sub:Rutinas}
1081
1082 \end_inset 
1083
1084 Rutinas
1085 \layout Standard
1086
1087 D provee varios tipos de rutinas, aunque todos basado en el mismo tipo básico,
1088  las funciones.
1089 \layout Subsubsection
1090
1091 Funciones planas (sin contexto)
1092 \layout Standard
1093
1094 Estas son las funciones más básicas.
1095  Son funciones de nivel 0 (en cuanto a anidamiento) o estáticas (ya sean
1096  anidadas o de clase), por lo que no necesitan de un contexto (cadena estática)
1097  más que la ubicación de la porción de variables globales (estáticas).
1098  Toman exactamente la cantidad de parámetros que se especifica en su declaración.
1099 \layout Standard
1100
1101 Por supuesto estás funciones tienen acceso solamente a las variables estáticas
1102  (conocidas en tiempo de compilación y almacenadas en el bloque de datos
1103  del programa), ya sean variables estáticas locales de una función o variables
1104  estáticas de clase (recordar que son todas variables globales con un 
1105 \emph on 
1106 scope
1107 \emph default 
1108  limitado).
1109 \layout Subsubsection
1110
1111 Funciones con contexto
1112 \layout Standard
1113
1114 Como ya hemos visto, en D hay algunas funciones que necesitan un 
1115 \emph on 
1116 contexto
1117 \emph default 
1118 .
1119  En esta categoría caen tanto los métodos de una instancia de clase como
1120  las funciones anidadas.
1121 \layout Standard
1122
1123 En el caso de los métodos es muy claro y simple, además de la función, se
1124  necesita saber sobre qué objeto se está aplicando, así que simplemente
1125  se agrega a los parámetros declarados un puntero (o referencia) a una instancia
1126  de la clase.
1127 \layout Standard
1128
1129 Con las funciones anidadas puede resultar un poco más confuso.
1130  Estás funciones necesitan el 
1131 \emph on 
1132 frame pointer
1133 \emph default 
1134  de la función 
1135 \emph on 
1136 padre
1137 \emph default 
1138  (lexicográficamente hablando) para poder obtener sus variables locales.
1139  Podría pensarse entonces, como si estás funciones agregan un parámetro
1140  extra con el puntero a ese 
1141 \emph on 
1142 frame pointer
1143 \emph default 
1144 .
1145 \layout Subsubsection
1146
1147 Funciones virtuales
1148 \layout Standard
1149
1150 Las funciones virtuales tienen la particularidad de no conocerse su dirección
1151  de memoria en tiempo de compilación, por lo tanto es necesario agregar
1152  un nivel de indirección al llamarlas.
1153  Es por esto también que es imposible que exista algún tipo de función virtual
1154  sin contexto, ya que debe haber algún contexto que indique, como mínimo,
1155  la dirección de la función a llamar.
1156  D provee funciones virtuales solamente como métodos de instancias de clase
1157  y lo hace de forma implícita (queda en manos del compilador determinar
1158  si una función debe ser virtual o no), es por esto que guarda, como se
1159  explicó en la sección 
1160 \begin_inset LatexCommand \vref{sub:repr-class}
1161
1162 \end_inset 
1163
1164 , una tabla virtual, en donde se almacena el puntero a cada función virtual
1165  de una clase.
1166  Entonces para llamar a una función virtual, se obtiene el objeto al que
1167  pertenece (
1168 \emph on 
1169 contexto
1170 \emph default 
1171 ) que tiene una tabla virtual.
1172  El offset de esa función en la tabla virtual sí se conoce en tiempo de
1173  compilación así que simplemente se ejecuta la función apuntada por vtable+4+off
1174 set (el 4 es porque lo primero que se almacena en la vtable es el puntero
1175  al objeto de tipo ClassInfo).
1176 \layout Subsubsection
1177
1178 Pasaje de parámetros
1179 \layout Standard
1180
1181 Las funciones toman parámetros, que son siempre por copia en su implementación
1182  real.
1183  El pasaje por referencia se resuelve al igual que en C, utilizando punteros.
1184  Hay un caso muy particular en D, que son las clases, que siempre son pasadas
1185  por referencias.
1186  Es decir, una variable de clase (que referencia una instancia de una clase)
1187  es siempre de tipo puntero, aunque sintácticamente sea utilizada como una
1188  variable común, semánticamente se comporta como un puntero.
1189 \layout Standard
1190
1191 Varias veces se menciona que los parámetros se copian si hay escritura (
1192 \emph on 
1193 copy on write
1194 \emph default 
1195 ) en la documentación de D, pero se comprobó empíricamente que, como se
1196  especifica en la sección de manejo de memoria, la copia por demanda se
1197  realiza solamente en la biblioteca estándar, no es algo que provea el lenguaje.
1198 \layout Subsubsection
1199
1200 Funciones con parámetros variables
1201 \layout Standard
1202
1203 Además soporta, al igual que C, parámetros variables, simplemente proveyendo
1204  métodos para obtener variables de la pila arbitrariamente.
1205  Es decir, a la hora de compilarse un llamado a una rutina con parámetros
1206  variables, se apilan todos los parámetros, se hace el 
1207 \emph on 
1208 call
1209 \emph default 
1210 , y luego se desapilan.
1211  La función llamada tiene entonces, métodos para obtener esos parámetros
1212  extra que no figuraban en la declaración de la función.
1213 \layout Subsubsection
1214
1215
1216 \begin_inset LatexCommand \label{sub:Sobrecarga-de-funciones}
1217
1218 \end_inset 
1219
1220 Sobrecarga de funciones
1221 \layout Standard
1222
1223 D permite sobrecargar funciones.
1224  Es decir, tener 2 funciones con el mismo nombre pero distintas firmas (cantidad
1225  y/o tipo de parámetros).
1226  Al igual que C++, no permite sobrecargar por el tipo de retorno solamente,
1227  ya que por proveer conversiones implícitas sería imposible desambiguar
1228  muchos casos.
1229  Por supuesto esto también debe poder traducirse a funciones planas por
1230  lo que debe haber una forma de identificar unívocamente a cada función
1231  (con un nombre único, asociado a su dirección de memoria).
1232  Para esto se utiliza una técnica conocida como 
1233 \emph on 
1234 name mangling
1235 \emph default 
1236 , que consiste en transformar los nombres de funciones a un nombre único,
1237  aunque no hay ninguna definición aún al respecto de como debe hacerlo D
1238  (fundamental para poder interactuar entre distintos compiladores, ya que
1239  de otra manera no podría encontrar los símbolos en código objeto compilado
1240  por otro compilador).
1241 \layout Standard
1242
1243 Entonces el compilador, a la hora de evaluar la dirección de una función
1244  sobrecargada, debe fijarse su nombre y sus parámetros, hacer el 
1245 \emph on 
1246 name mangling
1247 \emph default 
1248  para obtener su identificador único y ahora si proseguir como si fuera
1249  un función común y corriente.
1250 \layout Section
1251
1252 Estructura del programa
1253 \layout Standard
1254
1255 La estructura general de un programa D es muy similar a la de uno en C++.
1256  Simplemente se compone de funciones y tipos definidos por el usuario.
1257  Existe una función especial llamada 
1258 \family typewriter 
1259 main()
1260 \family default 
1261  que es el punto de partida del programa, indispensable a menos que estemos
1262  construyendo una biblioteca.
1263 \layout Subsection
1264
1265 Módulos
1266 \layout Standard
1267
1268 D elimina el preprocesador e incorpora el concepto de módulo (a diferencia
1269  de C++ que utiliza espacios de nombre).
1270  El módulo tiene alcance de archivo y tiene correspondencia 1 a 1 con la
1271  ruta y nombre del archivo.
1272  Por ejemplo el módulo 
1273 \family typewriter 
1274 mi.primer.modulo
1275 \family default 
1276  se busca en 
1277 \family typewriter 
1278 mi/primer/modulo.d
1279 \family default 
1280 .
1281  A la ruta representada como módulo se la llama 
1282 \emph on 
1283 paquete
1284 \emph default 
1285 ; es decir, el módulo 
1286 \family typewriter 
1287 modulo
1288 \family default 
1289  pertenece al paquete 
1290 \family typewriter 
1291 mi.primer
1292 \family default 
1293 .
1294  El módulo entonces provee un espacio de nombres, cuyos símbolos pueden
1295  ser importados en otros módulos.
1296  Por ejemplo:
1297 \layout Standard
1298
1299 modulo1.d:
1300 \layout LyX-Code
1301
1302 import modulo2;
1303 \layout LyX-Code
1304
1305 class C
1306 \layout LyX-Code
1307
1308 {
1309 \layout LyX-Code
1310
1311         float i;
1312 \layout LyX-Code
1313
1314 }
1315 \layout LyX-Code
1316
1317 void func(modulo2.C c)
1318 \layout LyX-Code
1319
1320 {
1321 \layout LyX-Code
1322
1323         printf("c.i = %d
1324 \backslash 
1325 n", c.i);
1326 \layout LyX-Code
1327
1328 }
1329 \layout Standard
1330
1331 modulo2.d:
1332 \layout LyX-Code
1333
1334 class C
1335 \layout LyX-Code
1336
1337 {
1338 \layout LyX-Code
1339
1340         int i;
1341 \layout LyX-Code
1342
1343 }
1344 \layout Standard
1345
1346 modulos.d
1347 \layout LyX-Code
1348
1349 import modulo1;
1350 \layout LyX-Code
1351
1352 import modulo2;
1353 \layout LyX-Code
1354
1355 int main()
1356 \layout LyX-Code
1357
1358 {
1359 \layout LyX-Code
1360
1361         func(new modulo2.C);
1362 \layout LyX-Code
1363
1364         return 0;
1365 \layout LyX-Code
1366
1367 }
1368 \layout Standard
1369
1370 Como se puede observar, no es imperativo poner el modulo al que pertenece
1371  un símbolo, a menos que se lo quiera desambiguar (si hay 2 símbolos con
1372  el mismo nombre en 2 módulos distintos).
1373 \layout Subsection
1374
1375 Compilación condicional
1376 \layout Standard
1377
1378 Al no proveer un precompilador, D provee un mecanismo de compilación condicional
1379  directamente incluida en el lenguaje.
1380  Simplemente se agregan bloques de código que se compilan solamente si se
1381  le pasa un cierto parámetro al compilador indicando que porción compilar.
1382  Este concepto va un poco más allá, ya que hay compilación condicional incluso
1383  de bloques no son puestos explícitamente como tales, como los bloques de
1384  invariante de representación de una clase o de pre y post condiciones de
1385  funciones.
1386  Ejemplo:
1387 \layout LyX-Code
1388
1389 version (OPTIMIZE)
1390 \layout LyX-Code
1391
1392 {
1393 \layout LyX-Code
1394
1395     version (DEBUG) printf(
1396 \begin_inset Quotes eld
1397 \end_inset 
1398
1399 entrando a optimización
1400 \begin_inset Quotes erd
1401 \end_inset 
1402
1403 );
1404 \layout LyX-Code
1405
1406     optimizar();
1407 \layout LyX-Code
1408
1409 }
1410 \layout Standard
1411
1412 D además provee varios identificadores de versión predefinidos, como la
1413  plataforma, 
1414 \emph on 
1415 endianess
1416 \emph default 
1417 , sistema operativo, etc.
1418 \layout Standard
1419
1420 Además provee otros métodos, como 
1421 \family typewriter 
1422 static if
1423 \family default 
1424
1425 \family typewriter 
1426 static assert
1427 \family default 
1428
1429 \family typewriter 
1430 iftype
1431 \family default 
1432  o 
1433 \family typewriter 
1434 debug
1435 \family default 
1436 , pero son todas vueltas de tuerca sobre el mismo concepto.
1437 \layout Subsection
1438
1439
1440 \begin_inset LatexCommand \label{sub:Assembly-embebido}
1441
1442 \end_inset 
1443
1444 Assembly embebido
1445 \layout Standard
1446
1447 D, al igual que C, permite embeber assembly en el lenguaje.
1448  Esto es útil para hacer código de alta performance para fragmentos críticos,
1449  ya que D está pensando como un lenguaje de alta performance y apto para
1450  el desarrollo de aplicaciones de sistema (como controladores, etc).
1451 \layout Section
1452
1453
1454 \begin_inset LatexCommand \label{sec:Orientación-a-objetos}
1455
1456 \end_inset 
1457
1458 Orientación a objetos
1459 \layout Standard
1460
1461 Como ya se ha mencionado, D provee orientación a objetos principalmente
1462  a través de el tipo class (ver sección 
1463 \begin_inset LatexCommand \vref{sub:tipo-class}
1464
1465 \end_inset 
1466
1467 ), pero provee algunos mecanismos también a través de los módulos o struct.
1468 \layout Subsection
1469
1470 Abstracción
1471 \layout Standard
1472
1473 La abstracción de datos puede darse a nivel de class, struct o module.
1474  Ambos proveen mecanismos para poder efectuar operaciones sobre un dato
1475  sin conocerlo.
1476  En el caso de struct y class es exactamente igual en cuanto a abstracción.
1477  El módulo es un poco diferente ya que hay sólo una instancia del mismo
1478  (es decir, todos sus datos son estáticos), pero también puede servir para
1479  abstraer.
1480  D provee sintaxis acoplada (
1481 \emph on 
1482 bundle
1483 \emph default 
1484 ) a través del operador de 
1485 \emph on 
1486 scope
1487 \emph default 
1488  
1489 \begin_inset Quotes eld
1490 \end_inset 
1491
1492 .
1493 \begin_inset Quotes erd
1494 \end_inset 
1495
1496 , que se utiliza tanto para class como para struct y module.
1497  El module, al no ser un tipo en sí, no soporta sintaxis desacoplada (
1498 \emph on 
1499 unbundle
1500 \emph default 
1501 ).
1502  Lo mismo pasa con los métodos estáticos de clase.
1503 \layout Standard
1504
1505 Todos los objetos en D son con estado explícito, aunque pueden 
1506 \emph on 
1507 emularse
1508 \emph default 
1509  objetos 
1510 \emph on 
1511 inmutables
1512 \emph default 
1513  declarándolos 
1514 \family typewriter 
1515 const
1516 \family default 
1517 , pero esto no hace se se resuelvan en tiempo de compilación, en realidad
1518  tienen estado sólo que el compilador no deja que se modifique.
1519  Es decir, no hay forma de tener abstracción declarativa.
1520 \layout Subsubsection
1521
1522 Propiedades
1523 \layout Standard
1524
1525 D provee un mecanismo muy interesante y práctico, las propiedades.
1526  Una clase (o estructura) puede tener métodos especiales que pueden ser
1527  llamados como si fueran atributos de la clase.
1528  No es más que azúcar sintáctico pero es muy útil y está implementado de
1529  una forma muy simple.
1530  Cualquier método que tenga un sólo argumento y devuelva un valor del mismo
1531  tipo se convierte en una propiedad de escritura y cualquier método que
1532  no tome argumentos y devuelva un valor se convierte en una propiedad de
1533  lectura.
1534  Incluyendo ambos se pueden tener propiedades de lectura/escritura.
1535  Veamos un ejemplo:
1536 \layout LyX-Code
1537
1538 class C
1539 \layout LyX-Code
1540
1541 {
1542 \layout LyX-Code
1543
1544         int _i;
1545 \layout LyX-Code
1546
1547         int read() { return _i; }
1548 \layout LyX-Code
1549
1550         int write(int i) { return _i = i; }
1551 \layout LyX-Code
1552
1553         int rw() { return _i; }
1554 \layout LyX-Code
1555
1556         int rw(int i) { return _i = i; }
1557 \layout LyX-Code
1558
1559 }
1560 \layout LyX-Code
1561
1562 int main()
1563 \layout LyX-Code
1564
1565 {
1566 \layout LyX-Code
1567
1568         C c = new C;
1569 \layout LyX-Code
1570
1571         // c.read = 1; NO COMPILA
1572 \layout LyX-Code
1573
1574         c.write = 2;
1575 \layout LyX-Code
1576
1577         printf("c.read = %d
1578 \backslash 
1579 n", c.read);
1580 \layout LyX-Code
1581
1582         // printf("c.read = %d
1583 \backslash 
1584 n", c.write); NO COMPILA
1585 \layout LyX-Code
1586
1587         c.rw = 3;
1588 \layout LyX-Code
1589
1590         printf("c.rw = %d
1591 \backslash 
1592 n", c.rw);
1593 \layout LyX-Code
1594
1595         return 0;
1596 \layout LyX-Code
1597
1598 }
1599 \layout Standard
1600
1601 Además todos los tipos básicos poseen propiedades, algunas comunes a todos
1602  (como 
1603 \family typewriter 
1604 sizeof
1605 \family default 
1606 , que devuelve su tamaño, en general estos son todos resueltos en tiempo
1607  de compilación) y otros particulares de cada tipo (como 
1608 \family typewriter 
1609 length
1610 \family default 
1611  para los array, que devuelve la cantidad de elementos que almacena).
1612 \layout Subsubsection
1613
1614 Sobrecarga de operadores
1615 \layout Standard
1616
1617 Otro mecanismo importante de abstracción que provee D es la sobrecarga de
1618  operadores.
1619  Se puede sobrecargar los operadores de clases y estructuras, de manera
1620  tal de hacerlos ver sintácticamente como tipos nativos del lenguaje.
1621  También es azúcar sintáctico y un caso particular de sobrecarga de funciones
1622  (ver página 
1623 \begin_inset LatexCommand \pageref{sub:Sobrecarga-de-funciones}
1624
1625 \end_inset 
1626
1627 ).
1628 \layout Subsection
1629
1630 Seguridad
1631 \layout Standard
1632
1633 D provee mecanismos de seguridad, tanto a nivel de módulo como de clase
1634  y estructuras, aunque se ha comprobado empíricamente que el compilador
1635  no lo está chequeando por el momento.
1636  Por ejemplo, el siguiente código compila y corre:
1637 \layout LyX-Code
1638
1639 class C
1640 \layout LyX-Code
1641
1642 {
1643 \layout LyX-Code
1644
1645         private int i;
1646 \layout LyX-Code
1647
1648 }
1649 \layout LyX-Code
1650
1651 int main()
1652 \layout LyX-Code
1653
1654 {
1655 \layout LyX-Code
1656
1657         C c = new C;
1658 \layout LyX-Code
1659
1660         c.i = 1;
1661 \layout LyX-Code
1662
1663         return 0;
1664 \layout LyX-Code
1665
1666 }
1667 \layout Subsection
1668
1669 Herencia
1670 \layout Standard
1671
1672 El único tipo que permite herencia es class (y su sub-tipo interface).
1673  D permite herencia simple entre clases comunes y una herencia múltiple
1674  limitada a través de las interfaces.
1675  Es decir, una clase sólo puede heredar de una sola clase, pero puede implementa
1676 r muchas interfaces.
1677 \layout Subsection
1678
1679 Polimorfismo
1680 \layout Standard
1681
1682 D implementa polimorfismo principalmente (pero no únicamente) a través de
1683  las clases (e interfaces) y sus funciones virtuales, pero también a través
1684  de la sobrecarga de funciones en general.
1685 \layout Subsubsection
1686
1687
1688 \begin_inset LatexCommand \label{sub:Polimorfismo-estático}
1689
1690 \end_inset 
1691
1692 Polimorfismo estático
1693 \layout Standard
1694
1695 D provee tipos genéricos, también conocidos en el mundo de los lenguajes
1696  compilados como 
1697 \emph on 
1698 templates
1699 \emph default 
1700  o polimorfismo estático, ya que permite que una función o clase se comporte
1701  de distinta manera pero se resuelve en tiempo de compilación.
1702 \layout Section
1703
1704 Excepciones
1705 \layout Standard
1706
1707 D provee un mecanismo de manejo de excepciones, con la sintaxis clásica
1708  de tipo 
1709 \family typewriter 
1710 try-catch-finally
1711 \family default 
1712 .
1713  D, al igual que C++, dice que el manejo de excepciones puede no ser 
1714 \emph on 
1715 performance-critical
1716 \emph default 
1717 , ya que debe manejar sólo casos muy esporádicos, situaciones inesperadas.
1718  D es más consistente en el uso de excepciones que C++, ya que utiliza excepcion
1719 es en muchos lugares en la biblioteca estándar, cosa que C++ no suele hacer
1720  y por lo cual el manejo de excepciones en ese lenguaje no suele ser muy
1721  utilizado.
1722 \layout Standard
1723
1724 Sin embargo no hay mucho más definido en D que la sintaxis del manejo de
1725  excepciones, nada se define sobre el mecanismo (excepto en Windows, donde
1726  dice que respeta la 
1727 \emph on 
1728 Microsoft Windows Structured Exception Handling
1729 \emph default 
1730 ).
1731  Es por eso que me limitaré a ejemplificar el manejo de excepciones a un
1732  ejemplo nada más:
1733 \layout LyX-Code
1734
1735 int main()
1736 \layout LyX-Code
1737
1738 {
1739 \layout LyX-Code
1740
1741     try
1742 \layout LyX-Code
1743
1744     {
1745 \layout LyX-Code
1746
1747         try
1748 \layout LyX-Code
1749
1750         {
1751 \layout LyX-Code
1752
1753             throw new Exception("first");
1754 \layout LyX-Code
1755
1756         }
1757 \layout LyX-Code
1758
1759         finally
1760 \layout LyX-Code
1761
1762         {
1763 \layout LyX-Code
1764
1765             printf("finally
1766 \backslash 
1767 n");
1768 \layout LyX-Code
1769
1770             throw new Exception("second");
1771 \layout LyX-Code
1772
1773         }
1774 \layout LyX-Code
1775
1776     }
1777 \layout LyX-Code
1778
1779     catch(Exception e)
1780 \layout LyX-Code
1781
1782     {
1783 \layout LyX-Code
1784
1785         printf("catch %.*s
1786 \backslash 
1787 n", e.msg);
1788 \layout LyX-Code
1789
1790     }
1791 \layout LyX-Code
1792
1793     printf("done
1794 \backslash 
1795 n");
1796 \layout LyX-Code
1797
1798 }
1799 \layout Standard
1800
1801 Los bloques 
1802 \emph on 
1803 try-catch-finally
1804 \emph default 
1805  pueden estar anidados.
1806 \layout Section
1807
1808 Paralelismo / Concurrencia
1809 \layout Standard
1810
1811 D provee algunas pocas primitivas para el soporte de concurrencia.
1812  En la biblioteca estándar provee una clase para ejecutar múltiples hilos
1813  y provee en el lenguaje la palabra reservada 
1814 \family typewriter 
1815 synchronized
1816 \family default 
1817  para agregar bloqueo y desbloqueo de exclusión mutua (
1818 \emph on 
1819 mutex
1820 \emph default 
1821 ) automáticamente antes y después (respectivamente) de bloque que encierra.
1822  También puede usarse como clasificador de almacén (es decir, para proteger
1823  una variable) o como modificador de una función (para proteger dicha función)
1824  o de clase o de cualquier otra sentencia.
1825 \layout Standard
1826
1827 Es necesario utilizar la clase 
1828 \family typewriter 
1829 Thread
1830 \family default 
1831  para ejecutar múltiples hilos ya que el recolector de basura tiene que
1832  saber de todos los hilos que están corriendo para poder administrar su
1833  memoria (y frenarlos ante un ciclo de recolección), aunque técnicamente
1834  podría evitarse ya que se puede acceder a cualquier biblioteca de C (incluyendo
1835  la de hilos).
1836 \layout Section
1837
1838
1839 \begin_inset LatexCommand \label{sec:Programación-segura}
1840
1841 \end_inset 
1842
1843 Programación segura
1844 \layout Standard
1845
1846 Uno de los objetivos principales de D es implementar técnicas de programación
1847  segura, para tratar de evitar (o al menos detectar) la mayor cantidad de
1848  errores de manera simple.
1849  Veamos entonces algunos mecanismos que provee para satisfacer este objetivo.
1850 \layout Subsection
1851
1852 Programación por contrato
1853 \layout Standard
1854
1855 La programación por contrato consiste en imponer ciertas reglas que se cumplan
1856  en distintos momentos del programa.
1857  Básicamente provee 3 conceptos para verificar estos 
1858 \emph on 
1859 contratos
1860 \emph default 
1861
1862 \emph on 
1863 assert
1864 \emph default 
1865 , invariantes de representación y pre y post condiciones.
1866  Esto parece contradecir el objetivo de D de ser un lenguaje de alta performance
1867 , ya que si se hacen muchos chequeos, inevitablemente se sacrifica performance.
1868  Pero esto no es necesariamente cierto, ya que todos estos mecanismos pueden
1869  ser desactivados en tiempo de compilación, logrando tener un código para
1870  depuración muy robusto y lleno de chequeos y un código para producción
1871  muy eficiente y rápido.
1872 \layout Subsubsection
1873
1874 assert
1875 \layout Standard
1876
1877 Este es el tipo más básico de contrato, provisto también de una forma más
1878  primitiva por C (a través del precompilador).
1879  Simplemente evalúa en tiempo de ejecución que una expresión evalúe a 
1880 \emph on 
1881 true
1882 \emph default 
1883 .
1884  Si no es así, simplemente el programa lanza una excepción.
1885 \layout Subsubsection
1886
1887 Invariante de representación
1888 \layout Standard
1889
1890 Las clases puede incluir un invariante de presentación.
1891  Esto es un fragmento de código que se ejecuta cada vez que se cambia una
1892  instancia de la clase (excepto cuando los cambios se realizan desde una
1893  función miembro.
1894  Esto permite asegurar que los objetos estén siempre en estado consistente,
1895  mientras se ejecute código que no conoce su representación.
1896  Por ejemplo:
1897 \layout LyX-Code
1898
1899 class Fecha
1900 \layout LyX-Code
1901
1902 {
1903 \layout LyX-Code
1904
1905         int dia = 1;
1906 \layout LyX-Code
1907
1908         int mes = 1;
1909 \layout LyX-Code
1910
1911         invariant
1912 \layout LyX-Code
1913
1914         {
1915 \layout LyX-Code
1916
1917                 assert(1 <= dia && dia <= 31);
1918 \layout LyX-Code
1919
1920                 assert(1 <= mes && mes <= 12);
1921 \layout LyX-Code
1922
1923         }
1924 \layout LyX-Code
1925
1926         void p()
1927 \layout LyX-Code
1928
1929         {
1930 \layout LyX-Code
1931
1932                 int d = dia;
1933 \layout LyX-Code
1934
1935                 dia = 50; // ok, dentro de la clase no se chequea
1936 \layout LyX-Code
1937
1938                 dia = d;
1939 \layout LyX-Code
1940
1941                 printf("%02d-%02d
1942 \backslash 
1943 n", dia, mes);
1944 \layout LyX-Code
1945
1946         }
1947 \layout LyX-Code
1948
1949 }
1950 \layout LyX-Code
1951
1952 Fecha f = new Fecha;
1953 \layout LyX-Code
1954
1955 f.p(); // ok
1956 \layout LyX-Code
1957
1958 f.dia = 40; // error!
1959 \layout Subsubsection
1960
1961 Pre y post condiciones
1962 \layout Standard
1963
1964 Toda función puede tener, además de su cuerpo, un bloque de código de pre-condic
1965 iones y/o un bloque de código de post-condiciones, que será ejecutado antes
1966  y/o después de ejecutar la función (respectivamente).
1967  Veamos un ejemplo:
1968 \layout LyX-Code
1969
1970 long raiz(long x)
1971 \layout LyX-Code
1972
1973     in
1974 \layout LyX-Code
1975
1976     {
1977 \layout LyX-Code
1978
1979         assert(x >= 0);
1980 \layout LyX-Code
1981
1982     }
1983 \layout LyX-Code
1984
1985     out (result)
1986 \layout LyX-Code
1987
1988     {
1989 \layout LyX-Code
1990
1991         assert((result * result) == x);
1992 \layout LyX-Code
1993
1994     }
1995 \layout LyX-Code
1996
1997     body
1998 \layout LyX-Code
1999
2000     {
2001 \layout LyX-Code
2002
2003         return cast(long) std.math.sqrt(cast(float) x);
2004 \layout LyX-Code
2005
2006     }
2007 \layout Standard
2008
2009 El parámetro del bloque 
2010 \family typewriter 
2011 out
2012 \family default 
2013  es el valor devuelto por el cuerpo de la función.
2014  Entonces cuando se llame a 
2015 \family typewriter 
2016 raiz(8)
2017 \family default 
2018 , el compilador (a menos que esté en modo 
2019 \emph on 
2020 release
2021 \emph default 
2022 ) lo traducirá a:
2023 \layout LyX-Code
2024
2025 assert(8 >= 0); // ok
2026 \layout LyX-Code
2027
2028 long tmp = raiz(8); // devuelve 2 por la conversión a long
2029 \layout LyX-Code
2030
2031 assert((2 * 2) == 8); // error!
2032 \layout Subsection
2033
2034 Casos de prueba
2035 \layout Standard
2036
2037 D provee dentro del lenguaje herramientas para realizar casos de prueba
2038  (
2039 \emph on 
2040 unit tests
2041 \emph default 
2042 ) para asegurarse que una clase se comporte como debe.
2043  Este código se ejecuta cuando se inicia el programa si se compila con la
2044  opción de 
2045 \family typewriter 
2046 unittest
2047 \family default 
2048 .
2049  Por ejemplo:
2050 \layout LyX-Code
2051
2052 class C
2053 \layout LyX-Code
2054
2055 {
2056 \layout LyX-Code
2057
2058         unittest
2059 \layout LyX-Code
2060
2061         {
2062 \layout LyX-Code
2063
2064                 assert(ok());
2065 \layout LyX-Code
2066
2067         }
2068 \layout LyX-Code
2069
2070         static bit ok() { return false; }
2071 \layout LyX-Code
2072
2073 }
2074 \layout Standard
2075
2076 Un programa que use esta clase saldrá apenas se inicia con una excepción
2077  por el 
2078 \family typewriter 
2079 assert
2080 \family default 
2081 .
2082 \layout Section
2083
2084 Conclusiones
2085 \layout Standard
2086
2087 Para analizar si el lenguaje cumple sus objetivos, vamos a analizar esos
2088  objetivos (ver página 
2089 \begin_inset LatexCommand \pageref{sub:Objetivo-del-lenguaje}
2090
2091 \end_inset 
2092
2093 ) punto por punto.
2094  Para el análisis se asume que todo lo propuesto en el lenguaje está correctamen
2095 te implementado (que, como vimos a lo largo de este documento, no es necesariame
2096 nte cierto).
2097 \layout Paragraph
2098
2099 Reducir el costo de desarrollo en al menos un 10% agregando características
2100  que mejoren la productividad y ajustando las características del lenguaje
2101  para que los errores más comunes que más cuestan reparar sean evitados
2102  de base.
2103 \layout Standard
2104
2105 Es difícil evaluar la ganancia en el costo de desarrollo (más aún si no
2106  está claro en comparación a qué se quiere reducir el costo), pero sin dudas
2107  el disponer de un recolector de basura, propiedades y otras muchas característi
2108 cas muy deseables deben reducir de forma considerable el costo de desarrollo.
2109 \layout Standard
2110
2111 Con respecto a los mecanismos para evitar los errores más comunes, por lo
2112  que he probado del lenguaje parece cumplirlo bastante bien, si uno se toma
2113  el trabajo de utilizar todas las herramientas que se le provee, en particular
2114  de las comentadas en la sección 
2115 \begin_inset LatexCommand \vref{sec:Programación-segura}
2116
2117 \end_inset 
2118
2119 .
2120 \layout Standard
2121
2122 En términos generales podría decirse que sí, cumple este objetivo.
2123 \layout Itemize
2124
2125 Hacer más fácil escribir programas portables entre compiladores, arquitecturas
2126  y sistemas operativos.
2127 \layout Paragraph
2128
2129 Soportar programación multi-paradigma; es decir, como mínimo, soportar los
2130  paradigmas: imperativo, estructurado, orientado a objetos y programación
2131  genérica.
2132 \layout Standard
2133
2134 Definitivamente cumple con estos objetivos mínimos, es un lenguaje netamente
2135  imperativo, con soporte de estructuras y todos los requerimientos de la
2136  programación orientada a objetos (a través de las clases, ver sección 
2137 \begin_inset LatexCommand \vref{sec:Orientación-a-objetos}
2138
2139 \end_inset 
2140
2141 ).
2142  Además provee un mecanismo para programación genérica, a través de templates
2143  (ver sección 
2144 \begin_inset LatexCommand \vref{sub:Polimorfismo-estático}
2145
2146 \end_inset 
2147
2148 ).
2149 \layout Paragraph
2150
2151 Tener una curva de aprendizaje corta para programadores que se sienten a
2152  gusto con C o C++.
2153 \layout Standard
2154
2155 Aunque tiene varias diferencias con C y C++, la sintaxis es muy similar
2156  y su uso en general también.
2157  Particularmente encuentro bastante molesto y confuso que las instancias
2158  de clase se manejen por referencia (en realidad encuentro confuso que sean
2159  una excepción).
2160  A pesar de esto, sin dudas la curva de aprendizaje es corta (aunque no
2161  nula), así que creo que este objetivo también lo cumple satisfactoriamente.
2162 \layout Paragraph
2163
2164 Proveer acceso irrestricto de bajo nivel cuando sea necesario.
2165 \layout Standard
2166
2167 Definitivamente también lo cumple.
2168  Soporta punteros (pág.
2169  
2170 \begin_inset LatexCommand \pageref{sub:Punteros}
2171
2172 \end_inset 
2173
2174 ), assembly embebido (pág.
2175  
2176 \begin_inset LatexCommand \pageref{sub:Assembly-embebido}
2177
2178 \end_inset 
2179
2180 ), alocación de memoria manual (pág.
2181  
2182 \begin_inset LatexCommand \pageref{sub:Variables}
2183
2184 \end_inset 
2185
2186 ), control sobre el recolector de basura (pág.
2187  
2188 \begin_inset LatexCommand \pageref{sub:Recolección-de-basura}
2189
2190 \end_inset 
2191
2192 ), etc.
2193 \layout Paragraph
2194
2195 Hacer que implementar un compilador sea mucho más sencillo que para C++.
2196 \layout Standard
2197
2198 Esto tampoco puede ser evaluado certeramente de forma sencilla, pero viendo
2199  como se simplificaron varias características de C++ que son particularmente
2200  complicadas de implementar (como la herencia múltiple) es de esperarse
2201  que hacer un compilador de D sea más sencillo que uno de C++, pero no podría
2202  afirmarlo porque tampoco conozco las complicaciones que adhiere D con las
2203  características no presentes en C++, como para saber cómo sale en el balance.
2204 \layout Paragraph
2205
2206 Ser compatible con la ABI local de C.
2207 \layout Standard
2208
2209 Lo cumple, puede interactuar con C sin inconvenientes.
2210 \layout Paragraph
2211
2212 Tener gramática libre de contexto.
2213 \layout Standard
2214
2215 Tampoco es algo que haya podido probar de forma sería, pero se eliminan
2216  construcciones de C que dependían del contexto como 
2217 \family typewriter 
2218 (foo) - p;
2219 \family default 
2220  que en C/C++ puede ser interpretado como la resta de
2221 \family typewriter 
2222  p
2223 \family default 
2224  a 
2225 \family typewriter 
2226 foo
2227 \family default 
2228  si
2229 \family typewriter 
2230  foo
2231 \family default 
2232  es una variable o como 
2233 \family typewriter 
2234 -p
2235 \family default 
2236  
2237 \emph on 
2238 casteado
2239 \emph default 
2240  a 
2241 \family typewriter 
2242 foo
2243 \family default 
2244  si 
2245 \family typewriter 
2246 foo
2247 \family default 
2248  es un tipo definido por el usuario.
2249  En D esa expresión es la resta, ya que para hacer el 
2250 \emph on 
2251 cast
2252 \emph default 
2253  hay que usar el operador: 
2254 \family typewriter 
2255 cast(foo) - p
2256 \family default 
2257 .
2258 \layout Standard
2259
2260 Entonces, si bien no puedo asegurar que el objetivo esté cumplido, sí puedo
2261  asegurar que está más cercano a tener una gramática menos dependiente del
2262  contexto que C/C++.
2263 \layout Paragraph
2264
2265 Escribir fácilmente aplicaciones internacionalizadas.
2266 \layout Standard
2267
2268 Tengo la sensación de haber visto en algún momento que había una forma de
2269  poner literales de string internacionalizables en el lenguaje, con el siguiente
2270  formato: 
2271 \family typewriter 
2272 _
2273 \begin_inset Quotes erd
2274 \end_inset 
2275
2276 hola
2277 \begin_inset Quotes erd
2278 \end_inset 
2279
2280
2281 \family default 
2282 .
2283  Esa característica parece que no existe más, al menos en la documentación,
2284  así que realmente no veo de qué manera se cumple este objetivo.
2285 \layout Paragraph
2286
2287 Incorporar Programación por Contrato y metodologías de casos de prueba.
2288 \layout Standard
2289
2290 Lo cumple muy bien, utilizando todo lo visto en la sección 
2291 \begin_inset LatexCommand \vref{sec:Programación-segura}
2292
2293 \end_inset 
2294
2295 .
2296 \layout Paragraph
2297
2298 Ser capaz de construir programas independientes y livianos.
2299 \layout Standard
2300
2301 Los programas son sin dudas menos livianos e independientes que los de C,
2302  porque además de depender de la biblioteca estándar de C (aunque no depende
2303  necesariamente, la biblioteca estándar de D la usa extensivamente), depende
2304  de la biblioteca propia de D, que incluye al código del recolector de basura.
2305  Compilando estáticamente, un programa que no hace nada:
2306 \layout LyX-Code
2307
2308 int main()
2309 \layout LyX-Code
2310
2311 {
2312 \layout LyX-Code
2313
2314         return 0;
2315 \layout LyX-Code
2316
2317 }
2318 \layout Standard
2319
2320 su versión en C y C++ ocupan 460KB, mientras que la versión en D ocupa 1.2MB.
2321 \layout Standard
2322
2323 Sin embargo, si hacemos el clásico ejemplo de 
2324 \emph on 
2325 hello world
2326 \emph default 
2327 :
2328 \layout LyX-Code
2329
2330 int main()
2331 \layout LyX-Code
2332
2333 {
2334 \layout LyX-Code
2335
2336         printf("hola mundo!
2337 \backslash 
2338 n");
2339 \layout LyX-Code
2340
2341         return 0;
2342 \layout LyX-Code
2343
2344 }
2345 \layout Standard
2346
2347 Si la versión en C++ la escribimos usando la STL
2348 \begin_inset Foot
2349 collapsed false
2350
2351 \layout Standard
2352
2353 Standard Template Library (la biblioteca estándar de C++)
2354 \end_inset 
2355
2356 :
2357 \layout LyX-Code
2358
2359 #include <iostream>
2360 \layout LyX-Code
2361
2362 int main()
2363 \layout LyX-Code
2364
2365 {
2366 \layout LyX-Code
2367
2368         std::cout << "hola mundo!
2369 \backslash 
2370 n";
2371 \layout LyX-Code
2372
2373         return 0;
2374 \layout LyX-Code
2375
2376 }
2377 \layout Standard
2378
2379 En C sigue ocupa 461KB, en D sigue ocupando 1.2MB y la versión en C++ pasa
2380  a ocupar 1.1MB, lo que pone en evidencia la alta complejidad de la biblioteca
2381  estándar de C++.
2382 \layout Standard
2383
2384 Por lo tanto, si bien D no puede ser tan liviano como C, sí puede sacarle
2385  una buena ventaja a C++ en lo que es el manejo de 
2386 \emph on 
2387 strings
2388 \emph default 
2389  u otras estructuras que provee la STL en C++ que son muy complejas.
2390 \the_end