URL - URL
Uniform Resource Locator | |
Postavení | Zveřejněno |
---|---|
Poprvé publikováno | 1994 |
Nejnovější verze |
Životní standard 2021 |
Organizace | Internet Engineering Task Force (IETF) |
Výbor | Pracovní skupina pro webovou hypertextovou aplikační technologii (WHATWG) |
Série | Žádost o komentáře (RFC) |
Redaktoři | Anne van Kesteren |
Autoři | Tim Berners-Lee |
Základní standardy |
RFC 3986 . - Uniform Resource Identifier (URI): Generic Syntax. RFC 4248 . - Schéma URI telnetu. |
Související standardy | URI , URN |
Doména | Celosvětová Síť |
Licence | CC BY 4.0 |
Zkratka | URL |
webová stránka | https://url.spec.whatwg.org |
Uniform Resource Locator ( URL ), hovorově nazývané webové adresy , je odkaz na webové zdroje , který určuje jeho umístění v počítačové síti a mechanismus pro získávání to. URL je specifický typ Uniform Resource Identifier (URI), ačkoli mnoho lidí používá tyto dva výrazy zaměnitelně. Adresy URL se nejčastěji používají k odkazování na webové stránky ( http ), ale také se používají pro přenos souborů ( ftp ), e -mail ( mailto ), přístup k databázi ( JDBC ) a mnoho dalších aplikací.
Většina webových prohlížečů zobrazuje adresu URL webové stránky nad stránkou v adresním řádku . Typická adresa URL může mít tvar http://www.example.com/index.html
, který označuje protokol ( http
), název hostitele ( www.example.com
) a název souboru ( index.html
).
Dějiny
Jednotné vyhledávače zdrojů byly definovány v RFC 1738 v roce 1994 Timem Bernersem-Leeem , vynálezcem World Wide Web a pracovní skupinou URI Internet Engineering Task Force (IETF), jako výsledek spolupráce zahájené v IETF Living Documents sezení ptáků v roce 1992.
Formát kombinuje již existující systém doménových jmen (vytvořený v roce 1985) se syntaxí cesty k souboru , kde lomítka slouží k oddělení názvů adresářů a souborů . Již existovaly konvence, kde názvy serverů mohly mít předponu pro dokončení cest k souborům, před kterými byla dvojitá lomítka ( //
).
Berners-Lee později vyjádřil lítost nad používáním teček k oddělení částí názvu domény v URI , přál si, aby v celém textu používal lomítka, a také řekl, že vzhledem k dvojtečce následující po první složce URI byla dvě lomítka před název domény byl zbytečný.
Časný (1993) návrh specifikace HTML odkazoval na „univerzální“ vyhledávače zdrojů. To bylo upuštěno nějaký čas od června 1994 (RFC 1630 ) do října 1994 (draft-ietf-uri-url-08.txt).
Syntax
Každá adresa URL HTTP odpovídá syntaxi obecného identifikátoru URI. Syntaxe obecného URI se skládá z hierarchické pořadí pěti složek :
URI = scheme:[//authority]path[?query] [#fragment]
kde se složka oprávnění rozděluje na tři dílčí součásti :
authority = [userinfo@]host[:port]
To je v diagramu syntaxe znázorněno jako:
URI obsahuje:
- Neprázdný
komponenta schématu následovaná dvojtečkou (
:
), skládající se ze sekvence znaků začínajících písmenem a následovaných libovolnou kombinací písmen, číslic, plus (+
), tečky (.
) nebo spojovníku (-
). Ačkoli schémata nerozlišují velká a malá písmena, kanonická forma je malá a dokumenty, které specifikují schémata, to musí dělat s malými písmeny. Příklady populárních programů patříhttp
,https
,ftp
,mailto
,file
,data
airc
. Schémata URI by měla být registrována uúřadu Internet Assigned Numbers Authority (IANA), ačkoli v praxi se používají neregistrovaná schémata. - Volitelné autoritní složka, které předchází dvě lomítka (
//
), zahrnující:- Volitelné dílčí komponenta userinfo, která se může skládat zuživatelského jménaa volitelnéhohesla,kterému předchází dvojtečka (
:
), za níž následuje symbol zavináč (@
). Použití formátuusername:password
v dílčí komponentě userinfo je z bezpečnostních důvodů zastaralé. Aplikace by neměly vykreslovat jako čistý text žádná data za první dvojtečkou (:
) nalezenou v rámci dílčí komponenty userinfo, pokud data za dvojtečkou nejsou prázdným řetězcem (bez hesla). - A subkomponenta hostitele , skládající se buď z registrovaného jména (včetně, ale bez omezení nanázev hostitele) neboIP adresy. AdresyIPv4musí být vdesítkové desítkové notaciaadresyIPv6musí být uzavřeny v závorkách (
[]
). - Volitelné port subcomponent, kterému předchází dvojtečka (
:
).
- Volitelné dílčí komponenta userinfo, která se může skládat zuživatelského jménaa volitelnéhohesla,kterému předchází dvojtečka (
- A složka cesty , skládající se ze sekvence segmentů cesty oddělených lomítkem (
/
). Pro identifikátor URI je vždy definována cesta, i když definovaná cesta může být prázdná (nulová délka). Segment může být také prázdný, což má za následek dvě po sobě jdoucí lomítka (//
) v komponentě cesty. Komponenta cesty se může podobat nebo mapovat přesně nacestu systému souborů,ale ne vždy to znamená vztah k jedné. Pokud je přítomna komponenta oprávnění, pak komponenta cesty musí být buď prázdná, nebo musí začínat lomítkem (/
). Pokud komponenta oprávnění chybí, cesta nemůže začínat prázdným segmentem, tj. Dvěma lomítky (//
), protože následující znaky by byly interpretovány jako komponenta oprávnění. Konečný segment cesty může být označován jako „slimák“.
Oddělovač dotazů | Příklad |
---|---|
Ampersand ( & )
|
key1=value1&key2=value2
|
Středník ( ; )
|
key1=value1;key2=value2
|
- Volitelné komponentu dotazu předcházející otazník (
?
), obsahujícířetězec dotazunehierarchických dat. Jeho syntaxe není dobře definována, ale konvencí je nejčastěji sekvencepárů atribut – hodnotaoddělenáoddělovačem. - Volitelné fragmentová složka, před kterou je znakhash(
#
). Fragment obsahujeidentifikátor fragmentuposkytující směr k sekundárnímu zdroji, jako je nadpis sekce v článku identifikovaný zbytkem URI. Když je primárním zdrojemdokumentHTML, fragment je častoid
atributemkonkrétního prvku a webové prohlížeče tento prvek posouvají do zobrazení.
Webový prohlížeč obvykle dereferuje na adresu URL provedením požadavku HTTP na zadaného hostitele, ve výchozím nastavení na portu číslo 80. Adresy URL používající https
schéma vyžadují, aby požadavky a odpovědi byly prováděny prostřednictvím zabezpečeného připojení k webu .
Internacionalizovaná adresa URL
Uživatelé internetu jsou distribuováni po celém světě pomocí široké škály jazyků a abeced a očekávají, že budou moci vytvářet adresy URL ve svých vlastních místních abecedách. Internationalized Resource Identifier (IRI) je forma adresy URL, která obsahuje znaky Unicode. Všechny moderní prohlížeče podporují IRI. Části adresy URL vyžadující zvláštní zacházení pro různé abecedy jsou název domény a cesta.
Název domény v IRI je známý jako Internationalized Domain Name (IDN). Webový a internetový software automaticky převádí název domény na punycode použitelný systémem Domain Name System; například čínská adresa URL se http://例子.卷筒纸
stane http://xn--fsqu00a.xn--3lr804guic/
. xn--
Naznačuje, že charakter nebyl původně ASCII.
Název cesty URL může také zadat uživatel v místním zapisovacím systému. Není-li již kódován, je převeden na UTF-8 a všechny znaky, které nejsou součástí základní znakové sady URL, jsou pomocí procentuálního kódování označeny jako hexadecimální ; například japonská adresa URL se stane . Cílový počítač dekóduje adresu a zobrazí stránku.
http://example.com/引き割り.html
http://example.com/%E5%BC%95%E3%81%8D%E5%89%B2%E3%82%8A.html
Adresy URL relativní k protokolu
Odkazy relativní k protokolu (PRL), známé také jako adresy URL relativní k protokolu (PRURL), jsou adresy URL, které nemají specifikován žádný protokol. Například //example.com
bude používat protokol aktuální stránky, obvykle HTTP nebo HTTPS.
Viz také
- Hypertextový odkaz
- PURL - trvalá adresa URL
- CURIE (kompaktní URI)
- Identifikátor fragmentu
- Internet Resource Locator (IRL)
- Internacionalizovaný identifikátor zdroje (IRI)
- Sémantická adresa URL
- Typosquatting
- Jednotný identifikátor zdroje
- Normalizace URL
- Použití lomítek v síti
Poznámky
Citace
Reference
- "Berners-Lee" omlouvám se "za lomítka" . BBC News . 2009-10-14 . Citováno 2010-02-14 .
- „Živé dokumenty BoF Minutes“ . World Wide Web Consortium . 18.03.1992 . Citováno 2011-12-26 .
- Berners-Lee, Tim (1994-03-21). „Uniform Resource Locators (URL): Syntax for the Express of Access Information of Objects on the Network“ . World Wide Web Consortium . Citováno 2015-09-13 .
- Berners-Lee, Tim ; Masinter, Larry ; McCahill, Mark Perry (srpen 1998). Uniform Resource Locators (URL) . doi : 10,17487/RFC1738 . RFC 1738 . Citováno 2015-08-31 .
- Berners-Lee, Tim (2015) [2000]. „Proč //, #atd.?“ . Často kladené otázky . World Wide Web Consortium . Citováno 2010-02-03 .
- Connolly, Daniel „Dan“ ; Sperberg-McQueen, C. Michael , eds. (2009-05-21). „Webové adresy v HTML 5“ . World Wide Web Consortium . Citováno 2015-09-13 .
- Internetová přiřazená čísla (2003-02-14). „Dokončení výběru IANA předponou IDNA“ . IETF-Oznámit seznam adresátů . Archivovány od originálu na 2004-12-08 . Citováno 2015-09-03 .
- Berners-Lee, Tim ; Fielding, Roy T .; Masinter, Larry (srpen 1998). Uniform Resource Identifiers (URI): Generic Syntax . doi : 10,17487/RFC2396 . RFC 2396 . Citováno 2015-08-31 .
- Hansen, Tony; Hardie, Ted (červen 2015). Thaler, Dave (ed.). Pokyny a registrační postupy pro schémata URI . doi : 10,17487/RFC7595 . RFC 7595 .
- Mealling, Michaeli ; Denenberg, Ray, eds. (Srpen 2002). Report from the Joint W3C/IETF URI Planning Interest Group: Uniform Resource Identifiers (URIs), URLs, and Uniform Resource Names (URNs): Clarifications and Odporúčání . doi : 10,17487/RFC3305 . RFC 3305 . Citováno 2015-09-13 .
- Berners-Lee, Tim ; Fielding, Roy T .; Masinter, Larry (leden 2005). Uniform Resource Identifiers (URI): Generic Syntax . doi : 10,17487/RFC3986 . RFC 3986 . Citováno 2015-08-31 .
- „Úvod do vícejazyčných webových adres“ . 2008-05-09 . Citováno 2015-01-11 .
- Phillip, A. (2014). „Co se děje s„ mezinárodními adresami URL “ “ . World Wide Web Consortium . Citováno 2015-01-11 .
- Lawrence, Eric. „Prohlížeč Arcana: IP literály v adresách URL“ . docs.microsoft.com . Archivováno od originálu dne 2020-06-22 . Citováno 2020-06-22 .