Subversion Repositories Kolibri OS

Rev

Rev 9177 | Go to most recent revision | Blame | Last modification | View Log | Download | RSS feed

  1.         Компилятор языка программирования Oberon-07/16 для x86_64
  2.                 Windows/Linux
  3. ------------------------------------------------------------------------------
  4.  
  5.         Параметры командной строки
  6.  
  7.   Вход - текстовые файлы модулей с расширением ".ob07", кодировка ANSI или
  8. UTF-8 с BOM-сигнатурой.
  9.   Выход - испоняемый файл формата PE32+ или ELF64.
  10.   Параметры:
  11.   1) имя главного модуля
  12.   2) тип приложения
  13.       "win64con" - Windows64 console
  14.       "win64gui" - Windows64 GUI
  15.       "win64dll" - Windows64 DLL
  16.       "linux64exe" - Linux ELF64-EXEC
  17.       "linux64so" - Linux ELF64-SO
  18.  
  19.   3) необязательные параметры-ключи
  20.       -out <file_name> имя результирующего файла; по умолчанию,
  21.       совпадает с именем главного модуля, но с другим расширением
  22.       (соответствует типу исполняемого файла)
  23.       -stk <size> размер стэка в мегабайтах (по умолчанию 2 Мб,
  24.        допустимо от 1 до 32 Мб)
  25.       -tab <width> размер табуляции (используется для вычисления координат в
  26.       исходном коде), по умолчанию - 4
  27.       -nochk <"ptibcwra"> отключить проверки при выполнении
  28.       -lower разрешить ключевые слова и встроенные идентификаторы в
  29.       нижнем регистре
  30.       -def <имя> задать символ условной компиляции
  31.       -uses вывести список импортированных модулей
  32.  
  33.       параметр -nochk задается в виде строки из символов:
  34.       "p" - указатели
  35.       "t" - типы
  36.       "i" - индексы
  37.       "b" - неявное приведение INTEGER к BYTE
  38.       "c" - диапазон аргумента функции CHR
  39.       "w" - диапазон аргумента функции WCHR
  40.       "r" - эквивалентно "bcw"
  41.       "a" - все проверки
  42.  
  43.       Порядок символов может быть любым. Наличие в строке того или иного
  44.       символа отключает соответствующую проверку.
  45.  
  46.       Например: -nochk it - отключить проверку индексов и охрану типа.
  47.       -nochk a - отключить все отключаемые проверки.
  48.  
  49.   Например:
  50.  
  51.   Compiler.exe "C:\example.ob07" win64con -out "C:\example.exe" -stk 1
  52.   Compiler.exe "C:\example.ob07" win64dll -out "C:\example.dll" -nochk pti
  53.   Compiler "source/Compiler.ob07" linux64exe -out "source/Compiler" -nochk a
  54.  
  55.   В случае успешной компиляции, компилятор передает код завершения 0, иначе 1.
  56.  
  57. ------------------------------------------------------------------------------
  58.         Отличия от оригинала
  59.  
  60. 1.      Расширен псевдомодуль SYSTEM
  61. 2.      В идентификаторах допускается символ "_"
  62. 3.      Добавлены системные флаги
  63. 4.      Усовершенствован оператор CASE (добавлены константные выражения в
  64.         метках вариантов и необязательная ветка ELSE)
  65. 5.      Расширен набор стандартных процедур
  66. 6.      Семантика охраны/проверки типа уточнена для нулевого указателя
  67. 7.      Добавлены однострочные комментарии (начинаются с пары символов "//")
  68. 8.      Разрешено наследование от типа-указателя
  69. 9.      Добавлен синтаксис для импорта процедур из внешних библиотек
  70. 10.     "Строки" можно заключать также в одиночные кавычки: 'строка'
  71. 11.     Добавлен тип WCHAR
  72. 12.     Добавлена операция конкатенации строковых и символьных констант
  73. 13.     Возможен импорт модулей с указанием пути и имени файла
  74. 14.     Добавлен специальный синтаксис для условной компиляции (см. CC.txt)
  75. 15.     Имя процедуры в конце объявления (после END) необязательно
  76.  
  77. ------------------------------------------------------------------------------
  78.         Особенности реализации
  79.  
  80. 1.      Основные типы
  81.  
  82.           Тип              Диапазон значений                      Размер, байт
  83.  
  84.         INTEGER       -9223372036854775808 .. 9223372036854775807       8
  85.         REAL          4.94E-324 .. 1.70E+308                            8
  86.         CHAR          символ ASCII (0X .. 0FFX)                         1
  87.         BOOLEAN       FALSE, TRUE                                       1
  88.         SET           множество из целых чисел {0 .. 63}                8
  89.         BYTE          0 .. 255                                          1
  90.         WCHAR         символ юникода (0X .. 0FFFFX)                     2
  91.  
  92. 2.      Максимальная длина идентификаторов - 255 символов
  93. 3.      Максимальная длина строковых констант - 511 символов (UTF-8)
  94. 4.      Максимальная размерность открытых массивов - 5
  95. 5.      Процедура NEW заполняет нулями выделенный блок памяти
  96. 6.      Глобальные и локальные переменные инициализируются нулями
  97. 7.      В отличие от многих Oberon-реализаций, сборщик мусора и динамическая
  98.         модульность отсутствуют
  99. 8.      Тип BYTE в выражениях всегда приводится к INTEGER
  100. 9.      Контроль переполнения значений выражений не производится
  101. 10.     Ошибки времени выполнения:
  102.  
  103.  1       ASSERT(x), при x = FALSE
  104.  2       разыменование нулевого указателя
  105.  3       целочисленное деление на неположительное число
  106.  4       вызов процедуры через процедурную переменную с нулевым значением
  107.  5       ошибка охраны типа
  108.  6       нарушение границ массива
  109.  7       непредусмотренное значение выражения в операторе CASE
  110.  8       ошибка копирования массивов v := x, если LEN(v) < LEN(x)
  111.  9       CHR(x), если (x < 0) OR (x > 255)
  112. 10       WCHR(x), если (x < 0) OR (x > 65535)
  113. 11       неявное приведение x:INTEGER к v:BYTE, если (x < 0) OR (x > 255)
  114.  
  115. ------------------------------------------------------------------------------
  116.         Псевдомодуль SYSTEM
  117.  
  118.   Псевдомодуль SYSTEM содержит низкоуровневые и небезопасные процедуры,
  119. ошибки при использовании процедур псевдомодуля SYSTEM могут привести к
  120. повреждению данных времени выполнения и аварийному завершению программы.
  121.  
  122.         PROCEDURE ADR(v: любой тип): INTEGER
  123.                 v - переменная или процедура;
  124.                 возвращает адрес v
  125.  
  126.         PROCEDURE SADR(x: строковая константа (CHAR UTF-8)): INTEGER
  127.                 возвращает адрес x
  128.  
  129.         PROCEDURE WSADR(x: строковая константа (WCHAR)): INTEGER
  130.                 возвращает адрес x
  131.  
  132.         PROCEDURE SIZE(T): INTEGER
  133.                 возвращает размер типа T
  134.  
  135.         PROCEDURE TYPEID(T): INTEGER
  136.                 T - тип-запись или тип-указатель,
  137.                 возвращает номер типа в таблице типов-записей
  138.  
  139.         PROCEDURE INF(): REAL
  140.                 возвращает специальное вещественное значение "бесконечность"
  141.  
  142.         PROCEDURE MOVE(Source, Dest, n: INTEGER)
  143.                 Копирует n байт памяти из Source в Dest,
  144.                 области Source и Dest не могут перекрываться
  145.  
  146.         PROCEDURE GET(a: INTEGER;
  147.                 VAR v: любой основной тип, PROCEDURE, POINTER)
  148.                 v := Память[a]
  149.  
  150.         PROCEDURE GET8(a: INTEGER;
  151.                        VAR x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  152.                 Эквивалентно
  153.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 1)
  154.  
  155.         PROCEDURE GET16(a: INTEGER;
  156.                         VAR x: INTEGER, SET, WCHAR, SYSTEM.CARD32)
  157.                 Эквивалентно
  158.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 2)
  159.  
  160.         PROCEDURE GET32(a: INTEGER; VAR x: INTEGER, SET, SYSTEM.CARD32)
  161.                 Эквивалентно
  162.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 4)
  163.  
  164.         PROCEDURE PUT(a: INTEGER; x: любой основной тип, PROCEDURE, POINTER)
  165.                 Память[a] := x;
  166.                 Если x: BYTE или x: WCHAR, то значение x будет расширено
  167.                 до 64 бит, для записи байтов использовать SYSTEM.PUT8,
  168.                 для WCHAR -- SYSTEM.PUT16
  169.  
  170.         PROCEDURE PUT8(a: INTEGER;
  171.                        x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  172.                 Память[a] := младшие 8 бит (x)
  173.  
  174.         PROCEDURE PUT16(a: INTEGER;
  175.                         x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  176.                 Память[a] := младшие 16 бит (x)
  177.  
  178.         PROCEDURE PUT32(a: INTEGER;
  179.                         x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  180.                 Память[a] := младшие 32 бит (x)
  181.  
  182.         PROCEDURE COPY(VAR Source: любой тип; VAR Dest: любой тип; n: INTEGER)
  183.                 Копирует n байт памяти из Source в Dest.
  184.                 Эквивалентно
  185.                 SYSTEM.MOVE(SYSTEM.ADR(Source), SYSTEM.ADR(Dest), n)
  186.  
  187.         PROCEDURE CODE(byte1, byte2,... : BYTE)
  188.                 Вставка машинного кода,
  189.                 byte1, byte2 ... - константы в диапазоне 0..255,
  190.                 например:
  191.  
  192.                 SYSTEM.CODE(048H,08BH,045H,010H) (* mov rax,qword[rbp+16] *)
  193.  
  194.   Также, в модуле SYSTEM определен тип CARD32 (4 байта). Для типа CARD32 не
  195. допускаются никакие явные операции, за исключением присваивания.
  196.  
  197.   Функции псевдомодуля SYSTEM нельзя использовать в константных выражениях.
  198.  
  199. ------------------------------------------------------------------------------
  200.         Системные флаги
  201.  
  202.   При объявлении процедурных типов и глобальных процедур, после ключевого
  203. слова PROCEDURE может быть указан флаг соглашения о вызове:
  204. [win64], [systemv], [windows], [linux], [oberon], [ccall].
  205. Например:
  206.  
  207.         PROCEDURE [win64] MyProc (x, y, z: INTEGER): INTEGER;
  208.  
  209.   Флаг [windows] - синоним для [win64], [linux] - синоним для [systemv].
  210.   Флаг [ccall] - синоним для [win64] или [systemv] (зависит от целевой ОС).
  211.   Знак "-" после имени флага ([win64-], [linux-], ...) означает, что
  212. результат процедуры можно игнорировать (не допускается для типа REAL).
  213.   Если флаг не указан или указан флаг [oberon], то принимается внутреннее
  214. соглашение о вызове. [win64] и [systemv] используются для связи с
  215. операционной системой и внешними приложениями.
  216.  
  217.   При объявлении типов-записей, после ключевого слова RECORD может быть
  218. указан флаг [noalign]. Флаг [noalign] означает отсутствие выравнивания полей
  219. записи. Записи с системным флагом не могут иметь базовый тип и не могут быть
  220. базовыми типами для других записей.
  221.   Для использования системных флагов, требуется импортировать SYSTEM.
  222.  
  223. ------------------------------------------------------------------------------
  224.         Оператор CASE
  225.  
  226.   Синтаксис оператора CASE:
  227.  
  228.         CaseStatement =
  229.                 CASE Expression OF Case {"|" Case}
  230.                         [ELSE StatementSequence] END.
  231.         Case = [CaseLabelList ":" StatementSequence].
  232.         CaseLabelList = CaseLabels {"," CaseLabels}.
  233.         CaseLabels = ConstExpression [".." ConstExpression].
  234.  
  235.   Например:
  236.  
  237.         CASE x OF
  238.         |-1:    DoSomething1
  239.         | 1:    DoSomething2
  240.         | 0:    DoSomething3
  241.         ELSE
  242.                 DoSomething4
  243.         END
  244.  
  245.   В метках вариантов можно использовать константные выражения, ветка ELSE
  246. необязательна. Если значение x не соответствует ни одному варианту и ELSE
  247. отсутствует, то программа прерывается с ошибкой времени выполнения.
  248.  
  249. ------------------------------------------------------------------------------
  250.         Тип WCHAR
  251.  
  252.   Тип WCHAR добавлен в язык для удобной поддежки юникода. Для типов WCHAR и
  253. ARRAY OF WCHAR допускаются все те же операции, как для типов CHAR и
  254. ARRAY OF CHAR, за исключением встроенной процедуры CHR, которая возвращает
  255. только тип CHAR. Для получения значения типа WCHAR, следует использовать
  256. процедуру WCHR вместо CHR. Для правильной работы с типом, необходимо сохранять
  257. исходный код в кодировке UTF-8 с BOM.
  258.  
  259. ------------------------------------------------------------------------------
  260.         Конкатенация строковых и символьных констант
  261.  
  262.   Допускается конкатенация ("+") константных строк и символов типа CHAR:
  263.  
  264.   str = CHR(39) + "string" + CHR(39); (* str = "'string'" *)
  265.  
  266.   newline = 0DX + 0AX;
  267.  
  268. ------------------------------------------------------------------------------
  269.         Проверка и охрана типа нулевого указателя
  270.  
  271.   Оригинальное сообщение о языке не определяет поведение программы при
  272. выполнении охраны p(T) и проверки типа p IS T при p = NIL. Во многих
  273. Oberon-реализациях выполнение такой операции приводит к ошибке времени
  274. выполнения. В данной реализации охрана типа нулевого указателя не приводит к
  275. ошибке, а проверка типа дает результат FALSE. В ряде случаев это позволяет
  276. значительно сократить частоту применения охраны типа.
  277.  
  278. ------------------------------------------------------------------------------
  279.         Дополнительные стандартные процедуры
  280.  
  281.         DISPOSE (VAR v: любой_указатель)
  282.                 Освобождает память, выделенную процедурой NEW для
  283.                 динамической переменной v^, и присваивает переменной v
  284.                 значение NIL.
  285.  
  286.         COPY (x: ARRAY OF CHAR/WCHAR; VAR v: ARRAY OF CHAR/WCHAR);
  287.                 v := x;
  288.                 Если LEN(v) < LEN(x), то строка x будет скопирована
  289.                 не полностью
  290.  
  291.         LSR (x, n: INTEGER): INTEGER
  292.                 Логический сдвиг x на n бит вправо.
  293.  
  294.         MIN (a, b: INTEGER): INTEGER
  295.                 Минимум из двух значений.
  296.  
  297.         MAX (a, b: INTEGER): INTEGER
  298.                 Максимум из двух значений.
  299.  
  300.         BITS (x: INTEGER): SET
  301.                 Интерпретирует x как значение типа SET.
  302.                 Выполняется на этапе компиляции.
  303.  
  304.         LENGTH (s: ARRAY OF CHAR/WCHAR): INTEGER
  305.                 Длина 0X-завершенной строки s, без учета символа 0X.
  306.                 Если символ 0X отсутствует, функция возвращает длину
  307.                 массива s. s не может быть константой.
  308.  
  309.         WCHR (n: INTEGER): WCHAR
  310.                 Преобразование типа, аналогично CHR(n: INTEGER): CHAR
  311.  
  312. ------------------------------------------------------------------------------
  313.         Импорт модулей с указанием пути и имени файла
  314.  
  315. Примеры:
  316.  
  317.     IMPORT Math IN "./lib/math.ob07"; (* относительно текущего модуля *)
  318.  
  319.     IMPORT M1 IN "C:\lib\math.ob07"; (* абсолютный путь *)
  320.  
  321. ------------------------------------------------------------------------------
  322.         Импортированные процедуры
  323.  
  324.   Синтаксис импорта:
  325.  
  326.   PROCEDURE [callconv, library, function] proc_name (FormalParam): Type;
  327.  
  328.   - callconv -- соглашение о вызове
  329.   - library -- имя файла динамической библиотеки (строковая константа)
  330.   - function -- имя импортируемой процедуры (строковая константа), если
  331.   указана пустая строка, то имя процедуры = proc_name
  332.  
  333.   например:
  334.  
  335.   PROCEDURE [windows, "kernel32.dll", "ExitProcess"] exit (code: INTEGER);
  336.  
  337.   PROCEDURE [windows, "kernel32.dll", ""] GetTickCount (): INTEGER;
  338.  
  339.   В конце объявления может быть добавлено (необязательно) "END proc_name;"
  340.  
  341.   Объявления импортированных процедур должны располагаться в глобальной
  342.   области видимости модуля после объявления переменных, вместе с объявлением
  343.   "обычных" процедур, от которых импортированные отличаются только отсутствием
  344.   тела процедуры. В остальном, к таким процедурам применимы те же правила:
  345.   их можно вызвать, присвоить процедурной переменной или получить адрес.
  346.  
  347.   Так как импортированная процедура всегда имеет явное указание соглашения о
  348.   вызове, то совместимый процедурный тип тоже должен быть объявлен с указанием
  349.   соглашения о вызове:
  350.  
  351.   VAR
  352.       ExitProcess: PROCEDURE [windows] (code: INTEGER);
  353.  
  354.   Для Linux, импортированные процедуры не реализованы.
  355.  
  356. ------------------------------------------------------------------------------
  357.         Скрытые параметры процедур
  358.  
  359.   Некоторые процедуры могут иметь скрытые параметры, они отсутствуют в списке
  360. формальных параметров, но учитываются компилятором при трансляции вызовов.
  361. Это возможно в следующих случаях:
  362.  
  363. 1.      Процедура имеет формальный параметр открытый массив:
  364.                 PROCEDURE Proc (x: ARRAY OF ARRAY OF REAL);
  365.         Вызов транслируется так:
  366.                 Proc(LEN(x), LEN(x[0]), SYSTEM.ADR(x))
  367. 2.      Процедура имеет формальный параметр-переменную типа RECORD:
  368.                 PROCEDURE Proc (VAR x: Rec);
  369.         Вызов транслируется так:
  370.                 Proc(SYSTEM.TYPEID(Rec), SYSTEM.ADR(x))
  371.  
  372.   Скрытые параметры необходимо учитывать при связи с внешними приложениями.
  373.  
  374. ------------------------------------------------------------------------------
  375.         Модуль RTL
  376.  
  377.   Все программы неявно используют модуль RTL. Компилятор транслирует
  378. некоторые операции (проверка и охрана типа, сравнение строк, сообщения об
  379. ошибках времени выполнения и др.) как вызовы процедур этого модуля. Не
  380. следует вызывать эти процедуры явно.
  381.   Сообщения об ошибках времени выполнения выводятся в диалоговых окнах
  382. (Windows), в терминал (Linux).
  383.  
  384. ------------------------------------------------------------------------------
  385.         Модуль API
  386.  
  387.   Существуют несколько реализаций модуля API (для различных ОС).
  388.   Как и модуль RTL, модуль API не предназначен для прямого использования.
  389. Он обеспечивает связь RTL с ОС.
  390.  
  391. ------------------------------------------------------------------------------
  392.         Генерация исполняемых файлов DLL
  393.  
  394.   Разрешается экспортировать только процедуры. Для этого, процедура должна
  395. находиться в главном модуле программы, ее имя должно быть отмечено символом
  396. экспорта ("*") и должно быть указано соглашение о вызове. Нельзя
  397. экспортировать процедуры, которые импортированы из других dll-библиотек.