W3C

Pangunahing Lengwahe sa HTML

World Wide Web Consortium Nota 13-March-1998

Bersyong Orihinal: W3C Orihinal
Mayakda: Joseph Rinoza Plazo.

Ang original na texto ay kinupkop ng internasyonal na copyright. Pakituon ng pansin ang original na reperensya mula sa mga hyperlinks para sa mas malalim na pagkaunawa."This translated text may contain conversion errors. Please refer to the original document at WC3 for normative version."

Itong Bersyon:
http://www.w3.org/TR/1998/NOTE-html-lan-19980313.html
Pinakabagong Bersyon:
http://www.w3.org/TR/NOTE-html-lan
Editor:
M.T. Carrasco Benitez [CAR] <manuel.carrasco@emea.eudra.org>

Kalagayan nitong Documento

Itong dokumento ay nota na pinapalaganap ng W3 Consortium para sa pagtatalakay lamang. Hindi ito nangangahulugan ng pagsangayon sa kanyang nilalaman. Ang Consortium ay hindi sumali sa paggawa nitong dokumento at hindi rin ito nagbibigay supporta sa mga isyu na lumilitaw.

Pinapahiwatig nitong dokumento kung paano mag-markup ng pangunahing lengwahe sa loob ng isang HTML dokumento. Ito ay tinutukoy na isang paglilinaw ng HTML 4.0 Spesipikasyon [HTML40]; kung susuriin, ay hindi humahadlang sa HTML 4.0 Spesipikasyon. Ang layunin ay ang pagkamit ng pinakamagandang proseso sa larangang ito upang mabuwag ang di pagkakaunawa.

Abstrakto

Para sa mga elemento ng HTML ang lang atributo ay tumutukoy sa lengwaheng natural. Pakiintindihin na itong dokumento ay tumutuon ng pansin sa pag talakay ng lengwaheng natural (maaring may hihigit sa isa) at ang base lengwahe (may isa lamang) sa dokumentong HTML.

Introduksyon

Karamihan sa kasalukuyang dokumento ay monolingual. Linguistikong Bersyon Ang mga translasyon ng texto ay nakatago bilang ibang dokumento. Ayon sa W3C, ito ay makabuluhan.

Ang mga dokumento are bilingwal, iilan ay trilingwal or n-lingual. Ang mga dokumentong bilingwal ay maiikli, madals ilang linya paragrapho lamang. Ang N-lingwal ay mas maikli pa. Ilang pangungusap.

Ang dokumentong -lingwal ay nilikha sa dahilang politikal; ie, sa ilang sitwasyon, hindi tama na may isang base lengwahe lamang. A pangkaraniwan ay ang pagkaroon ng isang maliit na dokumento na may maraming lengwahe. Por ehemplo, Ang Europa server nge Komisyong European [EUR].

Isa pang daan sa pagpili ng lengwage ay ang pagtakda ng kliyente (eg browser) sa lengwaheng nais. Ang kliyente ay magpapadala ng lengwahe sa Accent-Language field ng HTTP. Kaagad, tutugon ang server at magpapadala na kaukulang dokumento. Halimbawa, ang bersyong Espanyol ay maiihain kung ang lengwaheng preperensya (sa browser) ay Espanyol of wikang Pranses at kung ang dokumento ay naroon (sa server) sa wikang Pranses, Aleman o Espanyol.

Saan Magtatakda ng Lengwaheng Pangunahin

Kailangan ng isang lugar na kung saan magtatakda ng isang lengwaheng pangunahin. Minumungkahi namin na ito ay matakda sa elementong META ng dokumento. Halimbawa:
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Language" Content="fr">
<TITLE>Mon doc</TITLE>
</HEAD>
<BODY>
Je suis un Berlinois.
</BODY>
</HTML>

Ang nilalaman ng Content attributo ng elementong META ay gayundin ang laman ng Content-Language header ng HTTP; i.e, isang comma-separated listahan ng lengwaheng koda. halimbawa:

<META HTTP-EQUIV="Content-Language" Content="fr,en">

Ang mga lengwaheng kodang ito ay syang ginagamit rin sa lang attributo ng ilange elementong HTML. Halimbawa:

<BODY LANG=fr>

Ang lengwaheng koda ay natakda sa [RFC1766]. Tignan din: 8.1.1 Language codes of the HTML 4.0 Specification [HTML40] and [RFC2068].

Ang ayos ng lengwaheng koda ng Content-Language ay importante. Ang unang lengwahe sa listahan ay ang lengwaheng base ng dokumento; ie kahit anung texto na hindi uli natakda ng lang attributo ay ang base lengwahe.

Ang META ay di dapat nakamarka ng hihigit sa isang lengwahe sa mga dokumento, kahit mga pragamento ng ibang lengwahe. Ang gabay sa pagtakda ng isang dokumento bilang monolingwal, bilingwal at n-lingwal ay ganun din para sa mga tunay na aklat.

Ang dahilan kung bakit kailangan magtakda ng META kesa sa elementong HTML sa loob ng lang attributo ay:

Ang isang lang attributo sa elementong HTML ay nangingibabaw sa lengwahe na nakatakda sa elementong META. May gabay na tinatawag na "The inheritance rules" sa loob ng 8.1.2 Language information and text direction of the HTML 4.0 Specification [HTML40].

Pagbibigay salamat

Ang mga mungkahi ay pagsangayon mula sa mailing listahan ng www-international@w3.org [LIST] ng W3C at ng pagpupulong ng Unicode Conference sa Mainz noong March 1997.

Maraming salamat kina

Reperensya

[CAR]
M.T. Carrasco Benitez. http://dragoman.org/
[EUR]
Europa. http://europa.eu.int/
[HTML40]
HTML 4.0 Spesipikasyon. http://www.w3.org/TR/REC-html40/
Lalo na:
2.3.1 Internationalization
5.1 The Document Character Set
7.4.4 Meta data
8 Language information and text direction
[LIST]
http://www.w3.org/International/O-misc-mlists.html
[RFC1766]
Tags for the Identification of Languages, H. Alvestrand, March 1995.
Ay mahahanap sa http://ds.internic.net/rfc/rfc1766.txt
[RFC2068]
Hypertext Transfer Protocol -- HTTP/1.1, R. Fielding, J. Gettys, J. Mogul, H. Frystyk Nielsen and T. Berners-Lee, January 1997.
Ay mahahanap sa http://ds.internic.net/rfc/rfc2068.txt
Lalo na sa:
3.10 Language Tags
12 Content Negotiation
12.3 Transparent Negotiation
14.4 Accept-Language
14.13 Content-Laguage
14.43 Vary
15.7 Privacy Issues Connected to Accept Headers