20 Declaração SGML do HTML 4

Nota: o número total de pontos do código permitidos no conjunto de caracteres do documento desta declaração inclui os primeiros 17 planos do [ISO10646] (17 vezes 65536). Esta limitação foi imposta dado que este número está limitado a um comprimento de 8 dígitos na corrente versão standard do SGML. Isto não implica nenhuma declaração acerca da possibilidade de restrição a longo termo dos caracteres em UCS aos primeiros 17 planos. É muito provável que a limitação no SGML a 8 caracteres seja removida antes, e que esta especificação seja actualizada até lá, a primeira atribuição de um carácter para além dos primeiros 17 planos.

Nota: no sentido estrito da palavra, o número de Registro ISO 177 refere-se ao estado original do documento [ISO10646] em 1993. As alterações efectuadas desde 1993 consistiram na adição de caracteres e numa única operação de reposicionamento de um vasto número de pontos de código para o Coreano Hangul (Emenda 5). As revisões da especificação do HTML 4 poderão actualizar a referência do ISO 10646, com vista a incluir mudanças adicionais.

20.1 A declaração SGML

<!SGML  "ISO 8879:1986 (WWW)"
    --
         Declaração SGML para a Linguagem de Marcação ou Codificação do Hipertexto na versão HTML 4
 
         Com suporte para os primeiros 17 planos do ISO 10646 e
         aumento dos limites das “tags” e das longitudes literais, etc.
    --
 
    CHARSET
          BASESET  "ISO Registration Number 177//CHARSET
                    ISO/IEC 10646-1:1993 UCS-4 with
                    implementation level 3//ESC 2/5 2/15 4/6"
         DESCSET 0       9       UNUSED
                 9       2       9
                 11      2       UNUSED
                 13      1       13
                 14      18      UNUSED
                 32      95      32
                 127     1       UNUSED
                 128     32      UNUSED
                 160     55136   160
                 55296   2048    UNUSED  -- SURROGATES --
                 57344   1056768 57344

CAPACITY        SGMLREF
                TOTALCAP        150000
                GRPCAP          150000
                ENTCAP          150000

SCOPE    DOCUMENT
SYNTAX
         SHUNCHAR CONTROLS 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
           17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 127
         BASESET  "ISO 646IRV:1991//CHARSET
                   Versão da Referência Internacional
                   (IRV)//ESC 2/8 4/2"
         DESCSET  0 128 0

         FUNCTION
                  RE            13
                  RS            10
                  SPACE         32
                  TAB SEPCHAR    9

         NAMING   LCNMSTRT ""
                  UCNMSTRT ""
                  LCNMCHAR ".-_:"
                  UCNMCHAR ".-_:"
                  NAMECASE GENERAL YES
                           ENTITY  NO
         DELIM    GENERAL  SGMLREF
                  HCRO "&#38;#x" -- 38 é o número do símbolo & --
                  SHORTREF SGMLREF
         NAMES    SGMLREF
         QUANTITY SGMLREF
                  ATTCNT   60      -- aumentado --
                  ATTSPLEN 65536   -- Estes são os valores maiores --
                  LITLEN   65536   -- permitidos na declaração --
                  NAMELEN  65536   -- Evita os limites fixados nas actuais --
                  PILEN    65536   -- Implementações dos agentes HTML --
                  TAGLVL   100
                  TAGLEN   65536
                  GRPGTCNT 150
                  GRPCNT   64

FEATURES
  MINIMIZE
    DATATAG  NO
    OMITTAG  YES
    RANK     NO
    SHORTTAG YES
  LINK
    SIMPLE   NO
    IMPLICIT NO
    EXPLICIT NO
  OTHER
    CONCUR   NO
    SUBDOC   NO
    FORMAL   YES
  APPINFO NONE
>