Subversion Repositories Kolibri OS

Rev

Go to most recent revision | Blame | Last modification | View Log | Download | RSS feed

  1.         Компилятор языка программирования Oberon-07/16 для x86_64
  2.                 Windows/Linux
  3. ------------------------------------------------------------------------------
  4.  
  5.         Параметры командной строки
  6.  
  7.   Вход - текстовые файлы модулей с расширением ".ob07", кодировка ANSI или
  8. UTF-8 с BOM-сигнатурой.
  9.   Выход - испоняемый файл формата PE32+ или ELF64.
  10.   Параметры:
  11.   1) имя главного модуля
  12.   2) тип приложения
  13.       "win64con" - Windows64 console
  14.       "win64gui" - Windows64 GUI
  15.       "win64dll" - Windows64 DLL
  16.       "linux64exe" - Linux ELF64-EXEC
  17.       "linux64so" - Linux ELF64-SO
  18.  
  19.   3) необязательные параметры-ключи
  20.       -out <file_name> имя результирующего файла; по умолчанию,
  21.       совпадает с именем главного модуля, но с другим расширением
  22.       (соответствует типу исполняемого файла)
  23.       -stk <size> размер стэка в мегабайтах (по умолчанию 2 Мб,
  24.        допустимо от 1 до 32 Мб)
  25.       -nochk <"ptibcwra"> отключить проверки при выполнении
  26.       -lower разрешить ключевые слова и встроенные идентификаторы в
  27.       нижнем регистре
  28.       -def <имя> задать символ условной компиляции
  29.  
  30.       параметр -nochk задается в виде строки из символов:
  31.       "p" - указатели
  32.       "t" - типы
  33.       "i" - индексы
  34.       "b" - неявное приведение INTEGER к BYTE
  35.       "c" - диапазон аргумента функции CHR
  36.       "w" - диапазон аргумента функции WCHR
  37.       "r" - эквивалентно "bcw"
  38.       "a" - все проверки
  39.  
  40.       Порядок символов может быть любым. Наличие в строке того или иного
  41.       символа отключает соответствующую проверку.
  42.  
  43.       Например: -nochk it - отключить проверку индексов и охрану типа.
  44.       -nochk a - отключить все отключаемые проверки.
  45.  
  46.   Например:
  47.  
  48.   Compiler.exe "C:\example.ob07" win64con -out "C:\example.exe" -stk 1
  49.   Compiler.exe "C:\example.ob07" win64dll -out "C:\example.dll" -nochk pti
  50.   Compiler "source/Compiler.ob07" linux64exe -out "source/Compiler" -nochk a
  51.  
  52.   В случае успешной компиляции, компилятор передает код завершения 0, иначе 1.
  53.  
  54. ------------------------------------------------------------------------------
  55.         Отличия от оригинала
  56.  
  57. 1.      Расширен псевдомодуль SYSTEM
  58. 2.      В идентификаторах допускается символ "_"
  59. 3.      Добавлены системные флаги
  60. 4.      Усовершенствован оператор CASE (добавлены константные выражения в
  61.         метках вариантов и необязательная ветка ELSE)
  62. 5.      Расширен набор стандартных процедур
  63. 6.      Семантика охраны/проверки типа уточнена для нулевого указателя
  64. 7.      Добавлены однострочные комментарии (начинаются с пары символов "//")
  65. 8.      Разрешено наследование от типа-указателя
  66. 9.      Добавлен синтаксис для импорта процедур из внешних библиотек
  67. 10.     "Строки" можно заключать также в одиночные кавычки: 'строка'
  68. 11.     Добавлен тип WCHAR
  69. 12.     Добавлена операция конкатенации строковых и символьных констант
  70. 13.     Возможен импорт модулей с указанием пути и имени файла
  71. 14.     Добавлен специальный синтаксис для условной компиляции (см. CC.txt)
  72. 15.     Имя процедуры в конце объявления (после END) необязательно
  73.  
  74. ------------------------------------------------------------------------------
  75.         Особенности реализации
  76.  
  77. 1.      Основные типы
  78.  
  79.           Тип              Диапазон значений                      Размер, байт
  80.  
  81.         INTEGER       -9223372036854775808 .. 9223372036854775807       8
  82.         REAL          4.94E-324 .. 1.70E+308                            8
  83.         CHAR          символ ASCII (0X .. 0FFX)                         1
  84.         BOOLEAN       FALSE, TRUE                                       1
  85.         SET           множество из целых чисел {0 .. 63}                8
  86.         BYTE          0 .. 255                                          1
  87.         WCHAR         символ юникода (0X .. 0FFFFX)                     2
  88.  
  89. 2.      Максимальная длина идентификаторов - 255 символов
  90. 3.      Максимальная длина строковых констант - 511 символов (UTF-8)
  91. 4.      Максимальная размерность открытых массивов - 5
  92. 5.      Процедура NEW заполняет нулями выделенный блок памяти
  93. 6.      Глобальные и локальные переменные инициализируются нулями
  94. 7.      В отличие от многих Oberon-реализаций, сборщик мусора и динамическая
  95.         модульность отсутствуют
  96. 8.      Тип BYTE в выражениях всегда приводится к INTEGER
  97. 9.      Контроль переполнения значений выражений не производится
  98. 10.     Ошибки времени выполнения:
  99.  
  100.  1       ASSERT(x), при x = FALSE
  101.  2       разыменование нулевого указателя
  102.  3       целочисленное деление на неположительное число
  103.  4       вызов процедуры через процедурную переменную с нулевым значением
  104.  5       ошибка охраны типа
  105.  6       нарушение границ массива
  106.  7       непредусмотренное значение выражения в операторе CASE
  107.  8       ошибка копирования массивов v := x, если LEN(v) < LEN(x)
  108.  9       CHR(x), если (x < 0) OR (x > 255)
  109. 10       WCHR(x), если (x < 0) OR (x > 65535)
  110. 11       неявное приведение x:INTEGER к v:BYTE, если (x < 0) OR (x > 255)
  111.  
  112. ------------------------------------------------------------------------------
  113.         Псевдомодуль SYSTEM
  114.  
  115.   Псевдомодуль SYSTEM содержит низкоуровневые и небезопасные процедуры,
  116. ошибки при использовании процедур псевдомодуля SYSTEM могут привести к
  117. повреждению данных времени выполнения и аварийному завершению программы.
  118.  
  119.         PROCEDURE ADR(v: любой тип): INTEGER
  120.                 v - переменная или процедура;
  121.                 возвращает адрес v
  122.  
  123.         PROCEDURE SADR(x: строковая константа (CHAR UTF-8)): INTEGER
  124.                 возвращает адрес x
  125.  
  126.         PROCEDURE WSADR(x: строковая константа (WCHAR)): INTEGER
  127.                 возвращает адрес x
  128.  
  129.         PROCEDURE SIZE(T): INTEGER
  130.                 возвращает размер типа T
  131.  
  132.         PROCEDURE TYPEID(T): INTEGER
  133.                 T - тип-запись или тип-указатель,
  134.                 возвращает номер типа в таблице типов-записей
  135.  
  136.         PROCEDURE INF(): REAL
  137.                 возвращает специальное вещественное значение "бесконечность"
  138.  
  139.         PROCEDURE MOVE(Source, Dest, n: INTEGER)
  140.                 Копирует n байт памяти из Source в Dest,
  141.                 области Source и Dest не могут перекрываться
  142.  
  143.         PROCEDURE GET(a: INTEGER;
  144.                 VAR v: любой основной тип, PROCEDURE, POINTER)
  145.                 v := Память[a]
  146.  
  147.         PROCEDURE GET8(a: INTEGER;
  148.                        VAR x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  149.                 Эквивалентно
  150.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 1)
  151.  
  152.         PROCEDURE GET16(a: INTEGER;
  153.                         VAR x: INTEGER, SET, WCHAR, SYSTEM.CARD32)
  154.                 Эквивалентно
  155.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 2)
  156.  
  157.         PROCEDURE GET32(a: INTEGER; VAR x: INTEGER, SET, SYSTEM.CARD32)
  158.                 Эквивалентно
  159.                 SYSTEM.MOVE(a, SYSTEM.ADR(x), 4)
  160.  
  161.         PROCEDURE PUT(a: INTEGER; x: любой основной тип, PROCEDURE, POINTER)
  162.                 Память[a] := x;
  163.                 Если x: BYTE или x: WCHAR, то значение x будет расширено
  164.                 до 64 бит, для записи байтов использовать SYSTEM.PUT8,
  165.                 для WCHAR -- SYSTEM.PUT16
  166.  
  167.         PROCEDURE PUT8(a: INTEGER;
  168.                        x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  169.                 Память[a] := младшие 8 бит (x)
  170.  
  171.         PROCEDURE PUT16(a: INTEGER;
  172.                         x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  173.                 Память[a] := младшие 16 бит (x)
  174.  
  175.         PROCEDURE PUT32(a: INTEGER;
  176.                         x: INTEGER, SET, BYTE, CHAR, WCHAR, SYSTEM.CARD32)
  177.                 Память[a] := младшие 32 бит (x)
  178.  
  179.         PROCEDURE COPY(VAR Source: любой тип; VAR Dest: любой тип; n: INTEGER)
  180.                 Копирует n байт памяти из Source в Dest.
  181.                 Эквивалентно
  182.                 SYSTEM.MOVE(SYSTEM.ADR(Source), SYSTEM.ADR(Dest), n)
  183.  
  184.         PROCEDURE CODE(byte1, byte2,... : BYTE)
  185.                 Вставка машинного кода,
  186.                 byte1, byte2 ... - константы в диапазоне 0..255,
  187.                 например:
  188.  
  189.                 SYSTEM.CODE(048H,08BH,045H,010H) (* mov rax,qword[rbp+16] *)
  190.  
  191.   Также, в модуле SYSTEM определен тип CARD32 (4 байта). Для типа CARD32 не
  192. допускаются никакие явные операции, за исключением присваивания.
  193.  
  194.   Функции псевдомодуля SYSTEM нельзя использовать в константных выражениях.
  195.  
  196. ------------------------------------------------------------------------------
  197.         Системные флаги
  198.  
  199.   При объявлении процедурных типов и глобальных процедур, после ключевого
  200. слова PROCEDURE может быть указан флаг соглашения о вызове:
  201. [win64], [systemv], [windows], [linux], [oberon], [ccall].
  202. Например:
  203.  
  204.         PROCEDURE [win64] MyProc (x, y, z: INTEGER): INTEGER;
  205.  
  206.   Флаг [windows] - синоним для [win64], [linux] - синоним для [systemv].
  207.   Флаг [ccall] - синоним для [win64] или [systemv] (зависит от целевой ОС).
  208.   Знак "-" после имени флага ([win64-], [linux-], ...) означает, что
  209. результат процедуры можно игнорировать (не допускается для типа REAL).
  210.   Если флаг не указан или указан флаг [oberon], то принимается внутреннее
  211. соглашение о вызове. [win64] и [systemv] используются для связи с
  212. операционной системой и внешними приложениями.
  213.  
  214.   При объявлении типов-записей, после ключевого слова RECORD может быть
  215. указан флаг [noalign]. Флаг [noalign] означает отсутствие выравнивания полей
  216. записи. Записи с системным флагом не могут иметь базовый тип и не могут быть
  217. базовыми типами для других записей.
  218.   Для использования системных флагов, требуется импортировать SYSTEM.
  219.  
  220. ------------------------------------------------------------------------------
  221.         Оператор CASE
  222.  
  223.   Синтаксис оператора CASE:
  224.  
  225.         CaseStatement =
  226.                 CASE Expression OF Case {"|" Case}
  227.                         [ELSE StatementSequence] END.
  228.         Case = [CaseLabelList ":" StatementSequence].
  229.         CaseLabelList = CaseLabels {"," CaseLabels}.
  230.         CaseLabels = ConstExpression [".." ConstExpression].
  231.  
  232.   Например:
  233.  
  234.         CASE x OF
  235.         |-1:    DoSomething1
  236.         | 1:    DoSomething2
  237.         | 0:    DoSomething3
  238.         ELSE
  239.                 DoSomething4
  240.         END
  241.  
  242.   В метках вариантов можно использовать константные выражения, ветка ELSE
  243. необязательна. Если значение x не соответствует ни одному варианту и ELSE
  244. отсутствует, то программа прерывается с ошибкой времени выполнения.
  245.  
  246. ------------------------------------------------------------------------------
  247.         Тип WCHAR
  248.  
  249.   Тип WCHAR добавлен в язык для удобной поддежки юникода. Для типов WCHAR и
  250. ARRAY OF WCHAR допускаются все те же операции, как для типов CHAR и
  251. ARRAY OF CHAR, за исключением встроенной процедуры CHR, которая возвращает
  252. только тип CHAR. Для получения значения типа WCHAR, следует использовать
  253. процедуру WCHR вместо CHR. Для правильной работы с типом, необходимо сохранять
  254. исходный код в кодировке UTF-8 с BOM.
  255.  
  256. ------------------------------------------------------------------------------
  257.         Конкатенация строковых и символьных констант
  258.  
  259.   Допускается конкатенация ("+") константных строк и символов типа CHAR:
  260.  
  261.   str = CHR(39) + "string" + CHR(39); (* str = "'string'" *)
  262.  
  263.   newline = 0DX + 0AX;
  264.  
  265. ------------------------------------------------------------------------------
  266.         Проверка и охрана типа нулевого указателя
  267.  
  268.   Оригинальное сообщение о языке не определяет поведение программы при
  269. выполнении охраны p(T) и проверки типа p IS T при p = NIL. Во многих
  270. Oberon-реализациях выполнение такой операции приводит к ошибке времени
  271. выполнения. В данной реализации охрана типа нулевого указателя не приводит к
  272. ошибке, а проверка типа дает результат FALSE. В ряде случаев это позволяет
  273. значительно сократить частоту применения охраны типа.
  274.  
  275. ------------------------------------------------------------------------------
  276.         Дополнительные стандартные процедуры
  277.  
  278.         DISPOSE (VAR v: любой_указатель)
  279.                 Освобождает память, выделенную процедурой NEW для
  280.                 динамической переменной v^, и присваивает переменной v
  281.                 значение NIL.
  282.  
  283.         COPY (x: ARRAY OF CHAR/WCHAR; VAR v: ARRAY OF CHAR/WCHAR);
  284.                 v := x;
  285.                 Если LEN(v) < LEN(x), то строка x будет скопирована
  286.                 не полностью
  287.  
  288.         LSR (x, n: INTEGER): INTEGER
  289.                 Логический сдвиг x на n бит вправо.
  290.  
  291.         MIN (a, b: INTEGER): INTEGER
  292.                 Минимум из двух значений.
  293.  
  294.         MAX (a, b: INTEGER): INTEGER
  295.                 Максимум из двух значений.
  296.  
  297.         BITS (x: INTEGER): SET
  298.                 Интерпретирует x как значение типа SET.
  299.                 Выполняется на этапе компиляции.
  300.  
  301.         LENGTH (s: ARRAY OF CHAR/WCHAR): INTEGER
  302.                 Длина 0X-завершенной строки s, без учета символа 0X.
  303.                 Если символ 0X отсутствует, функция возвращает длину
  304.                 массива s. s не может быть константой.
  305.  
  306.         WCHR (n: INTEGER): WCHAR
  307.                 Преобразование типа, аналогично CHR(n: INTEGER): CHAR
  308.  
  309. ------------------------------------------------------------------------------
  310.         Импорт модулей с указанием пути и имени файла
  311.  
  312. Примеры:
  313.  
  314.     IMPORT Math IN "./lib/math.ob07"; (* относительно текущего модуля *)
  315.  
  316.     IMPORT M1 IN "C:\lib\math.ob07"; (* абсолютный путь *)
  317.  
  318. ------------------------------------------------------------------------------
  319.         Импортированные процедуры
  320.  
  321.   Синтаксис импорта:
  322.  
  323.   PROCEDURE [callconv, library, function] proc_name (FormalParam): Type;
  324.  
  325.   - callconv -- соглашение о вызове
  326.   - library -- имя файла динамической библиотеки (строковая константа)
  327.   - function -- имя импортируемой процедуры (строковая константа), если
  328.   указана пустая строка, то имя процедуры = proc_name
  329.  
  330.   например:
  331.  
  332.   PROCEDURE [windows, "kernel32.dll", "ExitProcess"] exit (code: INTEGER);
  333.  
  334.   PROCEDURE [windows, "kernel32.dll", ""] GetTickCount (): INTEGER;
  335.  
  336.   В конце объявления может быть добавлено (необязательно) "END proc_name;"
  337.  
  338.   Объявления импортированных процедур должны располагаться в глобальной
  339.   области видимости модуля после объявления переменных, вместе с объявлением
  340.   "обычных" процедур, от которых импортированные отличаются только отсутствием
  341.   тела процедуры. В остальном, к таким процедурам применимы те же правила:
  342.   их можно вызвать, присвоить процедурной переменной или получить адрес.
  343.  
  344.   Так как импортированная процедура всегда имеет явное указание соглашения о
  345.   вызове, то совместимый процедурный тип тоже должен быть объявлен с указанием
  346.   соглашения о вызове:
  347.  
  348.   VAR
  349.       ExitProcess: PROCEDURE [windows] (code: INTEGER);
  350.  
  351.   Для Linux, импортированные процедуры не реализованы.
  352.  
  353. ------------------------------------------------------------------------------
  354.         Скрытые параметры процедур
  355.  
  356.   Некоторые процедуры могут иметь скрытые параметры, они отсутствуют в списке
  357. формальных параметров, но учитываются компилятором при трансляции вызовов.
  358. Это возможно в следующих случаях:
  359.  
  360. 1.      Процедура имеет формальный параметр открытый массив:
  361.                 PROCEDURE Proc (x: ARRAY OF ARRAY OF REAL);
  362.         Вызов транслируется так:
  363.                 Proc(LEN(x), LEN(x[0]), SYSTEM.ADR(x))
  364. 2.      Процедура имеет формальный параметр-переменную типа RECORD:
  365.                 PROCEDURE Proc (VAR x: Rec);
  366.         Вызов транслируется так:
  367.                 Proc(SYSTEM.TYPEID(Rec), SYSTEM.ADR(x))
  368.  
  369.   Скрытые параметры необходимо учитывать при связи с внешними приложениями.
  370.  
  371. ------------------------------------------------------------------------------
  372.         Модуль RTL
  373.  
  374.   Все программы неявно используют модуль RTL. Компилятор транслирует
  375. некоторые операции (проверка и охрана типа, сравнение строк, сообщения об
  376. ошибках времени выполнения и др.) как вызовы процедур этого модуля. Не
  377. следует вызывать эти процедуры явно.
  378.   Сообщения об ошибках времени выполнения выводятся в диалоговых окнах
  379. (Windows), в терминал (Linux).
  380.  
  381. ------------------------------------------------------------------------------
  382.         Модуль API
  383.  
  384.   Существуют несколько реализаций модуля API (для различных ОС).
  385.   Как и модуль RTL, модуль API не предназначен для прямого использования.
  386. Он обеспечивает связь RTL с ОС.
  387.  
  388. ------------------------------------------------------------------------------
  389.         Генерация исполняемых файлов DLL
  390.  
  391.   Разрешается экспортировать только процедуры. Для этого, процедура должна
  392. находиться в главном модуле программы, ее имя должно быть отмечено символом
  393. экспорта ("*") и должно быть указано соглашение о вызове. Нельзя
  394. экспортировать процедуры, которые импортированы из других dll-библиотек.