Subversion Repositories Kolibri OS

Rev

Rev 9177 | Go to most recent revision | Blame | Compare with Previous | Last modification | View Log | Download | RSS feed

  1.         Компилятор языка программирования Oberon-07/16 для i486
  2.                 Windows/Linux/KolibriOS.
  3. ------------------------------------------------------------------------------
  4.  
  5.         Параметры командной строки
  6.  
  7.   Вход - текстовые файлы модулей с расширением ".ob07", кодировка ANSI или
  8. UTF-8 с BOM-сигнатурой.
  9.   Выход - испоняемый файл формата PE32, ELF или MENUET01/MSCOFF.
  10.   Параметры:
  11.   1) имя главного модуля
  12.   2) тип приложения
  13.       "win32con" - Windows console
  14.       "win32gui" - Windows GUI
  15.       "win32dll" - Windows DLL
  16.       "linux32exe" - Linux ELF-EXEC
  17.       "linux32so"  - Linux ELF-SO
  18.       "kosexe" - KolibriOS
  19.       "kosdll" - KolibriOS DLL
  20.  
  21.   3) необязательные параметры-ключи
  22.       -out <file_name> имя результирующего файла; по умолчанию,
  23.       совпадает с именем главного модуля, но с другим расширением
  24.       (соответствует типу исполняемого файла)
  25.       -stk <size> размер стэка в мегабайтах (по умолчанию 2 Мб,
  26.        допустимо от 1 до 32 Мб)
  27.       -nochk <"ptibcwra"> отключить проверки при выполнении (см. ниже)
  28.       -lower разрешить ключевые слова и встроенные идентификаторы в
  29.       нижнем регистре
  30.       -def <имя> задать символ условной компиляции
  31.       -ver <major.minor> версия программы (только для kosdll)
  32.  
  33.       параметр -nochk задается в виде строки из символов:
  34.       "p" - указатели
  35.       "t" - типы
  36.       "i" - индексы
  37.       "b" - неявное приведение INTEGER к BYTE
  38.       "c" - диапазон аргумента функции CHR
  39.       "w" - диапазон аргумента функции WCHR
  40.       "r" - эквивалентно "bcw"
  41.       "a" - все проверки
  42.  
  43.       Порядок символов может быть любым. Наличие в строке того или иного
  44.       символа отключает соответствующую проверку.
  45.  
  46.       Например: -nochk it - отключить проверку индексов и охрану типа.
  47.       -nochk a - отключить все отключаемые проверки.
  48.  
  49.   Например:
  50.  
  51.   Compiler.exe "C:\example.ob07" win32con -out "C:\example.exe" -stk 1
  52.   Compiler.exe "C:\example.ob07" win32dll -out "C:\example.dll"
  53.   Compiler.exe "C:\example.ob07" win32gui -out "C:\example.exe" -stk 4
  54.   Compiler.exe "C:\example.ob07" win32con -out "C:\example.exe" -nochk pti
  55.   Compiler.kex "/tmp0/1/example.ob07" kosexe -out "/tmp0/1/example.kex" -stk 4
  56.   Compiler.kex "/tmp0/1/example.ob07" kosdll -out "/tmp0/1/mydll.obj" -ver 2.7
  57.   Compiler.exe "C:\example.ob07" linux32exe -out "C:\example" -stk 1 -nochk a
  58.  
  59.   В случае успешной компиляции, компилятор передает код завершения 0, иначе 1.
  60. При работе компилятора в KolibriOS, код завершения не передается.
  61.  
  62. ------------------------------------------------------------------------------
  63.         Отличия от оригинала
  64.  
  65. 1.      Расширен псевдомодуль SYSTEM
  66. 2.      В идентификаторах допускается символ "_"
  67. 3.      Добавлены системные флаги
  68. 4.      Усовершенствован оператор CASE (добавлены константные выражения в
  69.         метках вариантов и необязательная ветка ELSE)
  70. 5.      Расширен набор стандартных процедур
  71. 6.      Семантика охраны/проверки типа уточнена для нулевого указателя
  72. 7.      Добавлены однострочные комментарии (начинаются с пары символов "//")
  73. 8.      Разрешено наследование от типа-указателя
  74. 9.      Добавлен синтаксис для импорта процедур из внешних библиотек
  75. 10.     "Строки" можно заключать также в одиночные кавычки: 'строка'
  76. 11.     Добавлен тип WCHAR
  77. 12.     Добавлена операция конкатенации строковых и символьных констант
  78. 13.     Возможен импорт модулей с указанием пути и имени файла
  79. 14.     Добавлен специальный синтаксис для условной компиляции (см. CC.txt)
  80. 15.     Имя процедуры в конце объявления (после END) необязательно
  81.  
  82. ------------------------------------------------------------------------------
  83.         Особенности реализации
  84.  
  85. 1.      Основные типы
  86.  
  87.           Тип              Диапазон значений               Размер, байт
  88.  
  89.         INTEGER       -2147483648 .. 2147483647                 4
  90.         REAL          4.94E-324 .. 1.70E+308                    8
  91.         CHAR          символ ASCII (0X .. 0FFX)                 1
  92.         BOOLEAN       FALSE, TRUE                               1
  93.         SET           множество из целых чисел {0 .. 31}        4
  94.         BYTE          0 .. 255                                  1
  95.         WCHAR         символ юникода (0X .. 0FFFFX)             2
  96.  
  97. 2.      Максимальная длина идентификаторов - 255 символов
  98. 3.      Максимальная длина строковых констант - 511 символов (UTF-8)
  99. 4.      Максимальная размерность открытых массивов - 5
  100. 5.      Процедура NEW заполняет нулями выделенный блок памяти
  101. 6.      Глобальные и локальные переменные инициализируются нулями
  102. 7.      В отличие от многих Oberon-реализаций, сборщик мусора и динамическая
  103.         модульность отсутствуют
  104. 8.      Тип BYTE в выражениях всегда приводится к INTEGER
  105. 9.      Контроль переполнения значений выражений не производится
  106. 10.     Ошибки времени выполнения:
  107.  
  108.  1      ASSERT(x), при x = FALSE
  109.  2      разыменование нулевого указателя
  110.  3      целочисленное деление на неположительное число
  111.  4      вызов процедуры через процедурную переменную с нулевым значением
  112.  5      ошибка охраны типа
  113.  6      нарушение границ массива
  114.  7      непредусмотренное значение выражения в операторе CASE
  115.  8      ошибка копирования массивов v := x, если LEN(v) < LEN(x)
  116.  9      CHR(x), если (x < 0) OR (x > 255)
  117. 10      WCHR(x), если (x < 0) OR (x > 65535)
  118. 11      неявное приведение x:INTEGER к v:BYTE, если (x < 0) OR (x > 255)
  119.  
  120. ------------------------------------------------------------------------------
  121.         Псевдомодуль SYSTEM
  122.  
  123.   Псевдомодуль SYSTEM содержит низкоуровневые и небезопасные процедуры,
  124. ошибки при использовании процедур псевдомодуля SYSTEM могут привести к
  125. повреждению данных времени выполнения и аварийному завершению программы.
  126.  
  127.         PROCEDURE ADR(v: любой тип): INTEGER
  128.                 v - переменная или процедура;
  129.                 возвращает адрес v
  130.  
  131.         PROCEDURE SADR(x: строковая константа (CHAR UTF-8)): INTEGER
  132.                 возвращает адрес x
  133.  
  134.         PROCEDURE WSADR(x: строковая константа (WCHAR)): INTEGER
  135.                 возвращает адрес x
  136.  
  137.         PROCEDURE SIZE(T): INTEGER
  138.                 возвращает размер типа T
  139.  
  140.         PROCEDURE TYPEID(T): INTEGER
  141.                 T - тип-запись или тип-указатель,
  142.                 возвращает номер типа в таблице типов-записей
  143.  
  144.         PROCEDURE INF(): REAL
  145.                 возвращает специальное вещественное значение "бесконечность"
  146.  
  147.         PROCEDURE MOVE(Source, Dest, n: INTEGER)
  148.                 Копирует n байт памяти из Source в Dest,
  149.                 области Source и Dest не могут перекрываться
  150.  
  151.         PROCEDURE GET(a: INTEGER;
  152.                 VAR v: любой основной тип, PROCEDURE, POINTER)
  153.                 v := Память[a]
  154.  
  155.         PROCEDURE GET8(a: INTEGER;
  156.                        VAR x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  157.                 Эквивалентно
  158.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 1)
  159.  
  160.         PROCEDURE GET16(a: INTEGER;
  161.                         VAR x: INTEGER, SET, WCHAR, SYSTEM.CARD32)
  162.                 Эквивалентно
  163.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 2)
  164.  
  165.         PROCEDURE GET32(a: INTEGER; VAR x: INTEGER, SET, SYSTEM.CARD32)
  166.                 Эквивалентно
  167.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 4)
  168.  
  169.         PROCEDURE PUT(a: INTEGER; x: любой основной тип, PROCEDURE, POINTER)
  170.                 Память[a] := x;
  171.                 Если x: BYTE или x: WCHAR, то значение x будет расширено
  172.                 до 32 бит, для записи байтов использовать SYSTEM.PUT8,
  173.                 для WCHAR -- SYSTEM.PUT16
  174.  
  175.         PROCEDURE PUT8(a: INTEGER;
  176.                        x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  177.                 Память[a] := младшие 8 бит (x)
  178.  
  179.         PROCEDURE PUT16(a: INTEGER;
  180.                         x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  181.                 Память[a] := младшие 16 бит (x)
  182.  
  183.         PROCEDURE PUT32(a: INTEGER;
  184.                         x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  185.                 Память[a] := младшие 32 бит (x)
  186.  
  187.         PROCEDURE COPY(VAR Source: любой тип; VAR Dest: любой тип; n: INTEGER)
  188.                 Копирует n байт памяти из Source в Dest.
  189.                 Эквивалентно
  190.                 SYSTEM.MOVE(SYSTEM.ADR(Source), SYSTEM.ADR(Dest), n)
  191.  
  192.         PROCEDURE CODE(byte1, byte2,... : INTEGER)
  193.                 Вставка машинного кода,
  194.                 byte1, byte2 ... - константы в диапазоне 0..255,
  195.                 например:
  196.                 SYSTEM.CODE(08BH, 045H, 008H) (* mov eax, dword [ebp + 08h] *)
  197.  
  198.   Также, в модуле SYSTEM определен тип CARD32 (4 байта). Для типа CARD32 не
  199. допускаются никакие явные операции, за исключением присваивания.
  200.  
  201.   Функции псевдомодуля SYSTEM нельзя использовать в константных выражениях.
  202.  
  203. ------------------------------------------------------------------------------
  204.         Системные флаги
  205.  
  206.   При объявлении процедурных типов и глобальных процедур, после ключевого
  207. слова PROCEDURE может быть указан флаг соглашения о вызове: [stdcall],
  208. [cdecl], [ccall], [windows], [linux], [oberon]. Например:
  209.  
  210.         PROCEDURE [ccall] MyProc (x, y, z: INTEGER): INTEGER;
  211.  
  212.   Если указан флаг [ccall], то принимается соглашение cdecl, но перед
  213. вызовом указатель стэка будет выравнен по границе 16 байт.
  214.   Флаг [windows] - синоним для [stdcall], [linux] - синоним для [ccall].
  215.   Знак "-" после имени флага ([stdcall-], [linux-], ...) означает, что
  216. результат процедуры можно игнорировать (не допускается для типа REAL).
  217.   Если флаг не указан или указан флаг [oberon], то принимается внутреннее
  218. соглашение о вызове.
  219.  
  220.   При объявлении типов-записей, после ключевого слова RECORD может быть
  221. указан флаг [noalign]. Флаг [noalign] означает отсутствие выравнивания полей
  222. записи. Записи с системным флагом не могут иметь базовый тип и не могут быть
  223. базовыми типами для других записей.
  224.   Для использования системных флагов, требуется импортировать SYSTEM.
  225.  
  226. ------------------------------------------------------------------------------
  227.         Оператор CASE
  228.  
  229.   Синтаксис оператора CASE:
  230.  
  231.         CaseStatement =
  232.                 CASE Expression OF Case {"|" Case}
  233.                         [ELSE StatementSequence] END.
  234.         Case = [CaseLabelList ":" StatementSequence].
  235.         CaseLabelList = CaseLabels {"," CaseLabels}.
  236.         CaseLabels = ConstExpression [".." ConstExpression].
  237.  
  238.   Например:
  239.  
  240.         CASE x OF
  241.         |-1:    DoSomething1
  242.         | 1:    DoSomething2
  243.         | 0:    DoSomething3
  244.         ELSE
  245.                 DoSomething4
  246.         END
  247.  
  248.   В метках вариантов можно использовать константные выражения, ветка ELSE
  249. необязательна. Если значение x не соответствует ни одному варианту и ELSE
  250. отсутствует, то программа прерывается с ошибкой времени выполнения.
  251.  
  252. ------------------------------------------------------------------------------
  253.         Тип WCHAR
  254.  
  255.   Тип WCHAR добавлен в язык для удобной поддежки юникода. Для типов WCHAR и
  256. ARRAY OF WCHAR допускаются все те же операции, как для типов CHAR и
  257. ARRAY OF CHAR, за исключением встроенной процедуры CHR, которая возвращает
  258. только тип CHAR. Для получения значения типа WCHAR, следует использовать
  259. процедуру WCHR вместо CHR. Для правильной работы с типом, необходимо сохранять
  260. исходный код в кодировке UTF-8 с BOM.
  261.  
  262. ------------------------------------------------------------------------------
  263.         Конкатенация строковых и символьных констант
  264.  
  265.   Допускается конкатенация ("+") константных строк и символов типа CHAR:
  266.  
  267.   str = CHR(39) + "string" + CHR(39); (* str = "'string'" *)
  268.  
  269.   newline = 0DX + 0AX;
  270.  
  271. ------------------------------------------------------------------------------
  272.         Проверка и охрана типа нулевого указателя
  273.  
  274.   Оригинальное сообщение о языке не определяет поведение программы при
  275. выполнении охраны p(T) и проверки типа p IS T при p = NIL. Во многих
  276. Oberon-реализациях выполнение такой операции приводит к ошибке времени
  277. выполнения. В данной реализации охрана типа нулевого указателя не приводит к
  278. ошибке, а проверка типа дает результат FALSE. В ряде случаев это позволяет
  279. значительно сократить частоту применения охраны типа.
  280.  
  281. ------------------------------------------------------------------------------
  282.         Дополнительные стандартные процедуры
  283.  
  284.         DISPOSE (VAR v: любой_указатель)
  285.                 Освобождает память, выделенную процедурой NEW для
  286.                 динамической переменной v^, и присваивает переменной v
  287.                 значение NIL.
  288.  
  289.         COPY (x: ARRAY OF CHAR/WCHAR; VAR v: ARRAY OF CHAR/WCHAR);
  290.                 v := x;
  291.                 Если LEN(v) < LEN(x), то строка x будет скопирована
  292.                 не полностью
  293.  
  294.         LSR (x, n: INTEGER): INTEGER
  295.                 Логический сдвиг x на n бит вправо.
  296.  
  297.         MIN (a, b: INTEGER): INTEGER
  298.                 Минимум из двух значений.
  299.  
  300.         MAX (a, b: INTEGER): INTEGER
  301.                 Максимум из двух значений.
  302.  
  303.         BITS (x: INTEGER): SET
  304.                 Интерпретирует x как значение типа SET.
  305.                 Выполняется на этапе компиляции.
  306.  
  307.         LENGTH (s: ARRAY OF CHAR/WCHAR): INTEGER
  308.                 Длина 0X-завершенной строки s, без учета символа 0X.
  309.                 Если символ 0X отсутствует, функция возвращает длину
  310.                 массива s. s не может быть константой.
  311.  
  312.         WCHR (n: INTEGER): WCHAR
  313.                 Преобразование типа, аналогично CHR(n: INTEGER): CHAR
  314.  
  315. ------------------------------------------------------------------------------
  316.         Импорт модулей с указанием пути и имени файла
  317.  
  318. Примеры:
  319.  
  320.     IMPORT Math IN "./lib/math.ob07"; (* относительно текущего модуля *)
  321.  
  322.     IMPORT M1 IN "C:\lib\math.ob07"; (* абсолютный путь *)
  323.  
  324. ------------------------------------------------------------------------------
  325.         Импортированные процедуры
  326.  
  327.   Синтаксис импорта:
  328.  
  329.   PROCEDURE [callconv, library, function] proc_name (FormalParam): Type;
  330.  
  331.   - callconv -- соглашение о вызове
  332.   - library -- имя файла динамической библиотеки (строковая константа)
  333.   - function -- имя импортируемой процедуры (строковая константа), если
  334.   указана пустая строка, то имя процедуры = proc_name
  335.  
  336.   например:
  337.  
  338.   PROCEDURE [windows, "kernel32.dll", ""] ExitProcess (code: INTEGER);
  339.  
  340.   PROCEDURE [stdcall, "Console.obj", "con_exit"] exit (bCloseWindow: BOOLEAN);
  341.  
  342.   В конце объявления может быть добавлено (необязательно) "END proc_name;"
  343.  
  344.   Объявления импортированных процедур должны располагаться в глобальной
  345.   области видимости модуля после объявления переменных, вместе с объявлением
  346.   "обычных" процедур, от которых импортированные отличаются только отсутствием
  347.   тела процедуры. В остальном, к таким процедурам применимы те же правила:
  348.   их можно вызвать, присвоить процедурной переменной или получить адрес.
  349.  
  350.   Так как импортированная процедура всегда имеет явное указание соглашения о
  351.   вызове, то совместимый процедурный тип тоже должен быть объявлен с указанием
  352.   соглашения о вызове:
  353.  
  354.   VAR
  355.       ExitProcess: PROCEDURE [windows] (code: INTEGER);
  356.       con_exit:    PROCEDURE [stdcall] (bCloseWindow: BOOLEAN);
  357.  
  358.   В KolibriOS импортировать процедуры можно только из библиотек, размещенных
  359.   в /rd/1/lib. Импортировать и вызывать функции инициализации библиотек
  360.   (lib_init, START) при этом не нужно.
  361.  
  362.   Для Linux, импортированные процедуры не реализованы.
  363.  
  364. ------------------------------------------------------------------------------
  365.         Скрытые параметры процедур
  366.  
  367.   Некоторые процедуры могут иметь скрытые параметры, они отсутствуют в списке
  368. формальных параметров, но учитываются компилятором при трансляции вызовов.
  369. Это возможно в следующих случаях:
  370.  
  371. 1.      Процедура имеет формальный параметр открытый массив:
  372.                 PROCEDURE Proc (x: ARRAY OF ARRAY OF REAL);
  373.         Вызов транслируется так:
  374.                 Proc(LEN(x), LEN(x[0]), SYSTEM.ADR(x))
  375. 2.      Процедура имеет формальный параметр-переменную типа RECORD:
  376.                 PROCEDURE Proc (VAR x: Rec);
  377.         Вызов транслируется так:
  378.                 Proc(SYSTEM.TYPEID(Rec), SYSTEM.ADR(x))
  379.  
  380.   Скрытые параметры необходимо учитывать при связи с внешними приложениями.
  381.  
  382. ------------------------------------------------------------------------------
  383.         Модуль RTL
  384.  
  385.   Все программы неявно используют модуль RTL. Компилятор транслирует
  386. некоторые операции (проверка и охрана типа, сравнение строк, сообщения об
  387. ошибках времени выполнения и др.) как вызовы процедур этого модуля. Не
  388. следует вызывать эти процедуры явно.
  389.   Сообщения об ошибках времени выполнения выводятся в диалоговых окнах
  390. (Windows), в терминал (Linux), на доску отладки (KolibriOS).
  391.  
  392. ------------------------------------------------------------------------------
  393.         Модуль API
  394.  
  395.   Существуют несколько реализаций модуля API (для различных ОС).
  396.   Как и модуль RTL, модуль API не предназначен для прямого использования.
  397. Он обеспечивает связь RTL с ОС.
  398.  
  399. ------------------------------------------------------------------------------
  400.         Генерация исполняемых файлов DLL
  401.  
  402.   Разрешается экспортировать только процедуры. Для этого, процедура должна
  403. находиться в главном модуле программы, и ее имя должно быть отмечено символом
  404. экспорта ("*"). Нельзя экспортировать процедуры, которые импортированы из
  405. других dll-библиотек.
  406.  
  407.   KolibriOS DLL всегда экспортируют идентификаторы "version" (версия
  408. программы) и "lib_init" - адрес процедуры инициализации DLL:
  409.  
  410.         PROCEDURE [stdcall] lib_init (): INTEGER
  411.  
  412. Эта процедура должна быть вызвана перед использованием DLL.
  413. Процедура всегда возвращает 1.