URL - URL

URL
Uniform Resource Locator
Postavení Zveřejněno
Poprvé publikováno 1994 ; Před 27 lety ( 1994 )
Nejnovější verze Životní standard
2021
Organizace Internet Engineering Task Force (IETF)
Výbor Pracovní skupina pro webovou hypertextovou aplikační technologii (WHATWG)
Série Žádost o komentáře (RFC)
Redaktoři Anne van Kesteren
Autoři Tim Berners-Lee
Základní standardy RFC  3986 . - Uniform Resource Identifier (URI): Generic Syntax.

RFC  4248 . - Schéma URI telnetu.
RFC  4266 . - Schéma URI gophera.
RFC  6068 . - Schéma URI „mailto“.
RFC  6196 . - Přesouvání poštovního serveru: Schéma URI na Historic.

RFC  6270 . - Schéma URI 'tn3270'.
Související standardy URI , URN
Doména Celosvětová Síť
Licence CC BY 4.0
Zkratka URL
webová stránka https://url.spec.whatwg.org

Uniform Resource Locator ( URL ), hovorově nazývané webové adresy , je odkaz na webové zdroje , který určuje jeho umístění v počítačové síti a mechanismus pro získávání to. URL je specifický typ Uniform Resource Identifier (URI), ačkoli mnoho lidí používá tyto dva výrazy zaměnitelně. Adresy URL se nejčastěji používají k odkazování na webové stránky ( http ), ale také se používají pro přenos souborů ( ftp ), e -mail ( mailto ), přístup k databázi ( JDBC ) a mnoho dalších aplikací.

Většina webových prohlížečů zobrazuje adresu URL webové stránky nad stránkou v adresním řádku . Typická adresa URL může mít tvar http://www.example.com/index.html, který označuje protokol ( http), název hostitele ( www.example.com) a název souboru ( index.html).

Dějiny

Jednoduchý příklad Uniform Resource Locator

Jednotné vyhledávače zdrojů byly definovány v RFC  1738 v roce 1994 Timem Bernersem-Leeem , vynálezcem World Wide Web a pracovní skupinou URI Internet Engineering Task Force (IETF), jako výsledek spolupráce zahájené v IETF Living Documents sezení ptáků v roce 1992.

Formát kombinuje již existující systém doménových jmen (vytvořený v roce 1985) se syntaxí cesty k souboru , kde lomítka slouží k oddělení názvů adresářů a souborů . Již existovaly konvence, kde názvy serverů mohly mít předponu pro dokončení cest k souborům, před kterými byla dvojitá lomítka ( //).

Berners-Lee později vyjádřil lítost nad používáním teček k oddělení částí názvu domény v URI , přál si, aby v celém textu používal lomítka, a také řekl, že vzhledem k dvojtečce následující po první složce URI byla dvě lomítka před název domény byl zbytečný.

Časný (1993) návrh specifikace HTML odkazoval na „univerzální“ vyhledávače zdrojů. To bylo upuštěno nějaký čas od června 1994 (RFC  1630 ) do října 1994 (draft-ietf-uri-url-08.txt).

Syntax

Každá adresa URL HTTP odpovídá syntaxi obecného identifikátoru URI. Syntaxe obecného URI se skládá z hierarchické pořadí pěti složek :

URI = scheme:[//authority]path[?query] [#fragment]

kde se složka oprávnění rozděluje na tři dílčí součásti :

authority = [userinfo@]host[:port]

To je v diagramu syntaxe znázorněno jako:

Diagram syntaxe URI

URI obsahuje:

  • Neprázdný komponenta schématu následovaná dvojtečkou (:), skládající se ze sekvence znaků začínajících písmenem a následovaných libovolnou kombinací písmen, číslic, plus (+), tečky (.) nebo spojovníku (-). Ačkoli schémata nerozlišují velká a malá písmena, kanonická forma je malá a dokumenty, které specifikují schémata, to musí dělat s malými písmeny. Příklady populárních programů patříhttp,https,ftp,mailto,file,dataairc. Schémata URI by měla být registrována uúřadu Internet Assigned Numbers Authority (IANA), ačkoli v praxi se používají neregistrovaná schémata.
  • Volitelné autoritní složka, které předchází dvě lomítka (//), zahrnující:
    • Volitelné dílčí komponenta userinfo, která se může skládat zuživatelského jménaa volitelnéhohesla,kterému předchází dvojtečka (:), za níž následuje symbol zavináč (@). Použití formátuusername:passwordv dílčí komponentě userinfo je z bezpečnostních důvodů zastaralé. Aplikace by neměly vykreslovat jako čistý text žádná data za první dvojtečkou (:) nalezenou v rámci dílčí komponenty userinfo, pokud data za dvojtečkou nejsou prázdným řetězcem (bez hesla).
    • A subkomponenta hostitele , skládající se buď z registrovaného jména (včetně, ale bez omezení nanázev hostitele) neboIP adresy. AdresyIPv4musí být vdesítkové desítkové notaciaadresyIPv6musí být uzavřeny v závorkách ([]).
    • Volitelné port subcomponent, kterému předchází dvojtečka (:).
  • A složka cesty , skládající se ze sekvence segmentů cesty oddělených lomítkem (/). Pro identifikátor URI je vždy definována cesta, i když definovaná cesta může být prázdná (nulová délka). Segment může být také prázdný, což má za následek dvě po sobě jdoucí lomítka (//) v komponentě cesty. Komponenta cesty se může podobat nebo mapovat přesně nacestu systému souborů,ale ne vždy to znamená vztah k jedné. Pokud je přítomna komponenta oprávnění, pak komponenta cesty musí být buď prázdná, nebo musí začínat lomítkem (/). Pokud komponenta oprávnění chybí, cesta nemůže začínat prázdným segmentem, tj. Dvěma lomítky (//), protože následující znaky by byly interpretovány jako komponenta oprávnění. Konečný segment cesty může být označován jako „slimák“.
Oddělovač dotazů Příklad
Ampersand ( &) key1=value1&key2=value2
Středník ( ;) key1=value1;key2=value2
  • Volitelné komponentu dotazu předcházející otazník (?), obsahujícířetězec dotazunehierarchických dat. Jeho syntaxe není dobře definována, ale konvencí je nejčastěji sekvencepárů atribut – hodnotaoddělenáoddělovačem.
  • Volitelné fragmentová složka, před kterou je znakhash(#). Fragment obsahujeidentifikátor fragmentuposkytující směr k sekundárnímu zdroji, jako je nadpis sekce v článku identifikovaný zbytkem URI. Když je primárním zdrojemdokumentHTML, fragment je častoidatributemkonkrétního prvku a webové prohlížeče tento prvek posouvají do zobrazení.

Webový prohlížeč obvykle dereferuje na adresu URL provedením požadavku HTTP na zadaného hostitele, ve výchozím nastavení na portu číslo 80. Adresy URL používající httpsschéma vyžadují, aby požadavky a odpovědi byly prováděny prostřednictvím zabezpečeného připojení k webu .

Internacionalizovaná adresa URL

Uživatelé internetu jsou distribuováni po celém světě pomocí široké škály jazyků a abeced a očekávají, že budou moci vytvářet adresy URL ve svých vlastních místních abecedách. Internationalized Resource Identifier (IRI) je forma adresy URL, která obsahuje znaky Unicode. Všechny moderní prohlížeče podporují IRI. Části adresy URL vyžadující zvláštní zacházení pro různé abecedy jsou název domény a cesta.

Název domény v IRI je známý jako Internationalized Domain Name (IDN). Webový a internetový software automaticky převádí název domény na punycode použitelný systémem Domain Name System; například čínská adresa URL se http://例子.卷筒纸stane http://xn--fsqu00a.xn--3lr804guic/. xn--Naznačuje, že charakter nebyl původně ASCII.

Název cesty URL může také zadat uživatel v místním zapisovacím systému. Není-li již kódován, je převeden na UTF-8 a všechny znaky, které nejsou součástí základní znakové sady URL, jsou pomocí procentuálního kódování označeny jako hexadecimální ; například japonská adresa URL se stane . Cílový počítač dekóduje adresu a zobrazí stránku. http://example.com/引き割り.htmlhttp://example.com/%E5%BC%95%E3%81%8D%E5%89%B2%E3%82%8A.html

Adresy URL relativní k protokolu

Odkazy relativní k protokolu (PRL), známé také jako adresy URL relativní k protokolu (PRURL), jsou adresy URL, které nemají specifikován žádný protokol. Například //example.combude používat protokol aktuální stránky, obvykle HTTP nebo HTTPS.

Viz také

Poznámky

Citace

Reference

externí odkazy