Versão original: Introduction to HTML 4   |  Traduzido por: De Sena Viegas


2 Introdução ao código HTML 4

Conteúdos

  1. O que é a World Wide Web?
    1. Introdução aos URIs
    2. Identificadores dos fragmentos
    3. URIs relativos
  2. O que é o HTML?
    1. Breve história do HTML
  3. HTML 4
    1. Internacionalização
    2. Acessibilidade
    3. Tabelas
    4. Documentos compostos
    5. Folhas de estilo
    6. Scripting
    7. Impressão
  4. Criação de documentos em HTML 4
    1. Estrutura e apresentação em separado
    2. Considerando a acessibilidade universal à Web
    3. Ajudar os agentes utentes com uma representação incremental

2.1 O que é a World Wide Web

A World Wide Web (Web) é uma rede de recursos e serviços de informação. Ela serve-se de três mecanismos, de modo a fazer com que esses recursos estejam legivelmente disponíveis à audiência mais vasta possível:

  1. Um esquema uniforme de atribuição de nomes, de forma a se poderem localizar os recursos na Web (ex: URIs).
  2. Protocolos, para o acesso aos recursos nomeados através da Web (ex: HTTP).
  3. Hipertexto, para uma navegação mais fácil através dos referidos recursos (ex: HTML).

Os laços entre os três mecanismos evidenciam-se através desta especificação.

2.1.1 Introdução aos URIs

Todos os recursos disponíveis na Web – documentos HTML, imagens, videoclips, programas, etc. – possuem um endereço, o qual poderá ser codificado por um Identificador de Recursos Universal, ou "URI" (Universal Resource Identifier).

Os URIs são de uma forma geral constituídos por três partes:

  1. O esquema de nomeação do mecanismo usado para se ter acesso ao recurso;
  2. O nome da máquina de hospedagem desse recurso;
  3. O nome do próprio recurso, atribuído na qualidade de trajecto (path).

Tome como exemplo o URI que designa a página dos Relatórios Técnicos da W3C:

 http://www.w3.org/TR

Este URI poderá ser lido da seguinte maneira: Existe um documento disponibilizado através do protocolo HTTP (ver [RFC2616]), hospedado na máquina www.w3.org, e ao qual se poderá ter acesso através do trajecto "/TR". Outros esquemas que você também poderá ver num documento HTML incluem “mailto” (destinados ao envio de emails) e “ftp” (destinados ao FTP).

Eis aqui mais um exemplo de um URI. Ele refere-se nomeadamente à caixa postal electrónica de um usuário:

 ...texto inserido...
Se tiver algum comentário a fazer, envie por favor um email para:
<a href="mailto:manel@algures.com">Manel da Bisca</a>.

Nota: A maioria dos leitores poderá estar familiarizada com o termo "URL" e não com o termo "URI". Os URLs são um subconjunto dos esquemas de nomeação mais utilizados, os URI.

2.1.2 Identificadores dos fragmentos

Alguns URIs referem-se a uma localização específica no interior de um recurso. Este tipo de URI termina em "#", seguido por uma âncora identificadora (designada por identificador do fragmento). Eis aqui, a título de exemplo, um URI apontando para a existência de uma âncora chamada de secção_2:

http://somesite.com/html/top.html#section_2

2.1.3 URIs relativos

Um URI relativo não contém qualquer tipo de informação referente à nomeação de um esquema. O seu “path” ou trajecto refere-se geralmente a um recurso hospedado na mesma máquina que o documento em questão. Os URIs relativos podem conter componentes de trajecto relativo (por ex: ".." - significa um nível acima, tendo como ponto de partida a hierarquia definida pelo "path" ou trajecto, e poderão ainda conter identificadores de fragmento.

Os URIs relativos são transformados em URIs definitivos, usando a base URI. Como tipo de exemplo para uma resolução URI, parta-se do princípio que nós temos a base URI designada por "http://www.acme.com/support/intro.html". O URI relativo na linguagem de etiquetagem (markup), destinado a uma ligação de hipertexto:

 <A href="suppliers.html">Fornecedores</A>

expandir-se-ia ao URI completo "http://www.acme.com/support/suppliers.html", ao passo que o URI relativo, no próximo exemplo de etiquetagem para uma imagem

 <IMG src="../icons/logo.gif" alt="logo">

se expandiria ao URI completo "http://www.acme.com/icons/logo.gif".

No HTML, os URIs são usados para:

Por favor, consulte a secção referente ao tipo URI, para mais informações acerca dos URIs.

2.2 O que é o HTML?

Para se publicar informação de distribuição global, é necessário utilizar-se uma linguagem de compreensão universal, uma espécie de Língua de publicação “Mãe”, a qual possa ser potencialmente usada e compreendida por todos os computadores. O HTML é a linguagem de publicação usada pela World Wide Web (do Inglês: Hyper Text Markup Language).

O HTML dá aos autores a possibilidade de:

2.2.1 Breve história do HTML

A linguagem de HTML foi originalmente concebida por Tim Berners-Lee, durante o seu trabalho no CERN, e popularizada pelo browser Mosaic, o qual foi desenvolvido na NCSA. No decorrer dos anos 90 ela floresceu com o crescimento explosivo da Web. Durante este tempo, o código HTML expandiu-se de variadas maneiras. A Web depende do facto dos autores das homepages e as empresas compartilharem as mesmas convenções HTML. Isso levou a que se realizasse um trabalho conjunto na criação das especificações HTML.

O código HTML2.0 (Novembro de 1995, ver [RFC1866]) desenvolvido debaixo da égide da InternetEngineering Task Force (IETF), com o intuito de codificar as práticas comuns nos finais de 1994. O HTML+ (1993) e o HTML 3.0 (1995, ver [HTML30]) propuseram versões melhoradas da linguagem HTML. Apesar de nunca se ter chegado a um consenso nas discussões gerais, esses esboços levaram à adopção de uma gama de nova características. Os esforços efectuados pelo Grupo de Trabalho HTML do Consórcio da World Wide Web em 1996 para codificar a prática comum, deu origem ao HTML 3.2 (Janeiro de 1997, ver [HTML32]). As alterações verificadas na versão HTML 3.2 são sumariadas no Apêndice A

A maioria das pessoas está de acordo com a necessidade dos documentos HTML poderem funcionar bem nas diferentes browsers e plataformas. Conseguindo a inter-operacionabilidade reduzem-se os custos aos fornecedores desde, contando com o facto deles terem de desenvolver apenas uma versão de um documento. Se não se fizerem esforços nesse sentido, existirá um risco maior da Web devolver aos proprietários um imenso número de formatos incompatíveis, reduzindo finalmente o seu potencial comercial para todos os participantes.

Cada versão do HTML tentou reflectir um maior consenso entre os industriais, de modo que o investimento feito pelos fornecedores satisfeitos não se desperdice e ainda que os seus documentos não se tornem ilegíveis ou inválidos num período de tempo curto.

O HTML foi desenvolvido com a perspectiva ou visão de que todos os dispositivos estarão aptos a usar a informação na Web: Computadores com uma representação gráfica de resolução e cor variadas, telefones celulares, dispositivos manuais, dispositivos destinados à entrada e à saída de voz, computadores de banda larga de alta e de baixa frequência, e outros afins.

2.3 HTML 4

O Código HTML 4 acrescenta à linguagem de HTML, mecanismos para as folhas de estilo, scripts, molduras, objectos integrados, suporte para texto à direita, à esquerda e em direcções mistas, tabelas mais completas e melhorias nos formulários, oferecendo assim uma maior e maior acessibilidade aos iniciados e a todos aqueles que nunca o manejaram.

O HTML 4.01 é uma revisão do HTML 4.0, a qual corrige os erros e efectua algumas alterações desde a versão anterior.

2.3.1 Internacionalização

Esta versão do HTML foi elaborada com a ajuda de peritos no campo da internacionalização, de uma maneira que os documentos possam ser escritos em várias linguagens e ainda circular pelo Mundo fora. Tal tarefa foi realizada através do incorporamento da referência [RFC2070], o qual se refere à internacionalização do HTML.

Um dos passos mais importantes foi a adopção do padrão ISO/IEC:10646 (ver[ISO10646]) como um conjunto de caracteres num documento, adaptados para o HTML. Este é o standard mais completo que se pode encontrar, lidando com questões directamente ligadas à representação internacional de caracteres, direcção do texto, pontuação e outras questões ligadas com as variadas linguagens mundiais.

O HTML oferece agora um suporte maior para as diferentes linguagens, no interior de um documento. Isso permite uma melhor indiciação dos documentos nas máquinas de busca, uma tipografia de alta qualidade, uma melhor conversão do texto para voz, uma melhor acentuação, etc.

2.3.2 Accessibilidade

À medida que a Comunidade Web vai aumentando e os seus membros se vão diversificando, sob um ponto de vista das suas capacidades e habilidades, é crucial que as tecnologias subjacentes sejam as mais apropriadas a essas necessidades específicas. O HTML foi elaborado de forma a tornar as páginas da Web mais acessíveis a todos aqueles cujos recursos físicos estejam limitados. Os melhoramentos no HTML 4, inspirados pela necessidade de um melhor acesso incluem:

Os autores que criem páginas a pensar nas questões de acessibilidade, não só receberão a benção pela parte da comunidade Web, como também usufruirão de outros benefícios: os documentos que sejam bem construídos, sob um ponto de vista HTML, os quais façam uma distinção entre estrutura e apresentação, adaptar-se-ão mais facilmente às novas tecnologias.

Nota: Para mais informações acerca da criação de documentos HTML mais acessíveis, consulte por favor o documento [WAI].

2.3.3 Tabelas

O novo modelo de tabelas em HTML é baseado no documento [RFC1942]. Os autores possuem agora um maior controlo sobre a estrutura e o layout (ex: os grupos de colunas). A possibilidade que os autores têm agora de estabelecerem larguras recomendadas para as colunas, permite aos agentes utentes disporem as os dados da tabela de uma forma mais desenvolvida (à medida que eles forem chegando), em vez de se ter de carregar a tabela inteira antes de a começar a representá-la.

Nota: pela altura que este documento foi escrito, algumas ferramentas de HTML baseavam-se no uso extensível das tabelas para efectuar a formatação dos documentos, facto que poderá facilmente causar problemas de acesso.

2.3.4 Documentos compostos

O HTML oferece agora um mecanismo standartizado para a integração de objectos genéricos e aplicações nos documentos HTML. O elemento OBJECT (conjuntamente com os seus elementos ancestrais mais específicos, nomeadamente APPLET) fornece um mecanismo que nos permite incluir imagens, vídeo, som, funções matemáticas, aplicações especializadas e outros objectos num documento. Ele permite ainda aos autores especificar a hierarquia das representações alternativas destinadas aos agentes utentes que não suportem uma determinada representação.

2.3.5 Folhas de estilo

As folhas de estilo simplificam a codificação em HTML, livrando-o ainda das responsabilidades de representação. Eles dão aos autores e utentes o absoluto controlo sobre a apresentação dos documentos – informação da fonte, alinhamento, cores, etc.

As informações do estilo poderão ser especificadas para os elementos individuais ou para grupos de elementos. As informações referentes ao estilo poderão ser especificadas num documento HTML ou em folhas de estilo externas.

O mecanismo ligados ao processo de associação de uma folha de estilo a um documento é independente da linguagem da folha de estilo que é utilizada.

Antes da invenção das folhas de estilo, os autores possuíam apenas um controlo limitado sobre a representação. O HTML 3.2 incluía um certo número de atributos e de elementos que ofereciam um controlo sobre o alinhamento, tamanho da fonte e cor do texto. Os autores também exploraram as tabelas e as imagens como forma de apresentar as páginas. O tempo relativamente demorado que os utentes levam a actualizar os seus navegadores, significa que essas propriedades continuarão ainda a ser utilizadas por algum tempo. Contudo, dado que as folhas de estilo oferecem mecanismos mais poderosos de apresentação, o Consórcio da Worl Wide Web declarará muitos dos elementos e atributos como obsoletos e ultrapassados. Ao longo desta especificação, os elementos e atributos em risco são marcados como " deprecated" (desaprovados). Eles são acompanhados por exemplos da forma que ilustram a forma como se conseguem os mesmos efeitos, usando outros elementos ou folhas de estilo.

2.3.6 Uso de Scripts

Através dos scripts, os autores podem criar páginas mais dinâmicas na Web (ex: “formas inteligentes” que reajam à forma como os utentes os preenchem) e usar o HTML como forma de criar aplicações de rede network.

Os mecanismos fornecidos para incluir os scripts num documento HTML são independentes da linguagem desses mesmos scripts.

2.3.7 Impressão

Por vezes, os autores quererão tornar mais fácil aos utentes, a tarefa de imprimir algo mais do que o simples documento em si. Quando os documentos fazem parte de um trabalho mais extenso, as relações entre eles poderá ser descrita através do uso do elemento HTML LINK ou usando a Estrutura da Descrição dos Recursos, do Inglês Resource Description Framework (RDF) (ver [RDF10]).

2.4 Criação de documentos em HTML 4

Nós recomendamos que os autores e implementadores atendam aos seguintes princípios gerais sempre que trabalharem com a linguagem HTML 4.

2.4.1 Separar estrutura e apresentação

O HTML tem as suas raízes na SGML, que foi sempre a linguagem destinada à especificação de etiquetagem ou codificação estrutural. Com o andar do tempo, são cada vez mais os elementos e atributos do HTML que são substituídos por outros mecanismos, em particular pelas folhas de estilo. A experiência demonstrou que ao se separar a estrutura de um documento dos seus aspectos de apresentação, reduzem-se os custos (relacionados com toda uma gama de plataformas e meios de comunicação usados) e facilita-se a revisão do documento.

2.4.2 Considerar o acesso universal à Web

Para tornar a Web mais acessível a todos, especialmente a todos aqueles que não tenham grandes habilidades (ou até mesmo incapacidades), os autores deverão considerar a forma como os seus documentos poderão ser apresentados nas diferentes plataformas existentes: browsers comandadas por voz, leitores braille, etc. De forma alguma recomendamos aqui que os autores limitem a sua criatividade, senão e antes que eles considerem apresentações alternativas dos seus designs. O código HTML oferece um certo número de mecanismos destinados a esse fim (ex: o atributo alt, o atributo accesskey, etc.)

Além disso, os autores deverão ter em conta que os seus documentos poderão ter uma audiência vasta e afastada e que os computadores poderão ter configurações diferentes. De forma a que os documentos possam ser correctamente interpretados, os autores deverão incluir nos seus documentos informação suficiente acerca da linguagem natural e direcção do texto, bem como acerca da forma como o documento foi codificado e outras questões relacionadas com a sua internacionalização.

2.4.3 Ajudar os agentes utentes com uma apresentação incremental

Através do desenho cuidadoso das tabelas e da aplicação das novas propriedades do HTML 4, os autores poderão ajudar os agentes utentes a representar os documentos mais rapidamente. Os autores podem aprender como desenhar tabelas para uma representação incremental (ver o elemento TABLE). Os implementadores poderão consultar as notas acerca das tabelas, no apêndice com informação acerca dos algoritmos incrementais.