Clique (teorie grafů) - Clique (graph theory)

Graf s
  • 23 × 1 vrchol kliky (vrcholy),
  • Kliky 42 × 2 vrcholy (okraje),
  • 19 × 3 vrcholové kliky (světlé a tmavě modré trojúhelníky) a
  • 2 × 4-vrcholové kliky (tmavě modré oblasti).
11 světle modrých trojúhelníků tvoří maximální kliky. Dvě tmavě modré 4 kliky jsou maximální i maximální a klikové číslo grafu je 4.

V matematickém oblasti teorie grafů , je klika ( / k l jsem k / nebo / k l ɪ k / ) je podmnožinou vrcholech undirected grafu tak, že každé dva různé vrcholy v klika vedle sebe. To znamená, že klika grafu je indukovaná podgrafem ze které je dokončena . Kliky jsou jedním ze základních konceptů teorie grafů a používají se v mnoha dalších matematických problémech a konstrukcích na grafech. Kliky byly také studovány v informatice: úkol zjistit, zda je v grafu klika dané velikosti ( problém kliky ), je NP-úplný , ale i přes tento výsledek tvrdosti bylo studováno mnoho algoritmů pro hledání klik.

I když studie o celých podgrafy sahá přinejmenším do grafu-teoretické reformulaci teorie Ramsey od Erdős a Szekeres (1935) , termín klika pochází z Luce & Perry (1949) , který použil kompletní subgraphs v sociálních sítích na modelových klik z lidé; tj. skupiny lidí, z nichž se všichni navzájem znají. Cliques mají mnoho dalších aplikací ve vědách a zejména v bioinformatice .

Definice

Klika , , v undirected grafu je podmnožinou vrcholů , tak, že každé dva odlišné vrcholy jsou vedle sebe. To je ekvivalentní podmínky, že indukovaná podgrafem z vyvolaná je úplný graf . V některých případech může termín klika také odkazovat přímo na podgraf.

Maximální klika je klika, která nemůže být prodloužena tím, že zahrnuje jednu sousední vrchol, to znamená, je klika, která neexistuje výhradně v vrcholu sady většího kliky. Někteří autoři definují kliky způsobem, který vyžaduje, aby byly maximální, a pro úplné podgrafy, které nejsou maximální, používají jinou terminologii.

Maximální klika grafu, je klika, takže není klika s více vrcholy. Navíc klikové číslo grafu je počet vrcholů v maximální klice v .

Počet křižovatka of je nejmenší počet klik, které dohromady pokrývají všechny hrany .

Číslo obalu kliky grafu je nejmenší počet kliků, jejichž sjednocení pokrývá množinu vrcholů grafu.

Maximální klika příčná grafu je podmnožinou vrcholů s vlastností, že každé maximální klika grafu obsahuje alespoň jeden vrchol v podskupině.

Opakem kliky je nezávislá množina v tom smyslu, že každá klika odpovídá nezávislé sadě v grafu komplementu . Problém obalu kliky se týká nalezení co nejméně klik, které zahrnují každý vrchol v grafu.

Souvisejícím konceptem je biclique , kompletní bipartitní podgraf . Dvoustranný rozměr grafu je minimální počet bicliques potřebných k pokrytí všech hran grafu.

Matematika

Mezi matematické výsledky týkající se klik patří následující.

  • Turánova věta udává dolní mez velikosti kliky v hustých grafech . Pokud má graf dostatečně mnoho hran, musí obsahovat velkou kliku. Například každý graf s vrcholy a více než hranami musí obsahovat kliku se třemi vrcholy.
  • Ramseyova věta uvádí, že každý graf nebo jeho graf komplementu obsahuje kliku s alespoň logaritmickým počtem vrcholů.
  • Podle výsledku Moon & Moser (1965) může mít graf se 3 n vrcholy nejvýše 3 n maximální kliky. Grafy splňující tuto hranici jsou Moon -Moserovy grafy K 3,3, ... , zvláštní případ turánských grafů vznikajících jako extrémní případy v Turánově větě.
  • Hadwiger dohad , ještě nevyzkoušené, se týká velikosti největší kliky moll v grafu (jeho Hadwiger číslo ) k jeho barevnosti .
  • Erdős-Faber-Lovász domněnka je další neprokázané tvrzení týkající barvení grafu na klik.

Jejich kliky lze definovat nebo charakterizovat několik důležitých tříd grafů:

  • Clusteru graf je graf, jehož připojená zařízení jsou kliky.
  • Blok graf je graf, jehož biconnected komponenty jsou kliky.
  • Chordal graf je graf, jehož vrcholy je možné objednat do dokonalého odstranění uspořádání, uspořádání tak, že sousedi z každého vrcholu V , které přijdou později než objem v uspořádání tvoří kliku.
  • Cograph je graf všech jehož indukované podgrafy mají tu vlastnost, že každá maximální klika protíná jakýkoli maximální nezávislé nastavení v jednom vrcholu.
  • Interval graf je graf, jehož maximální kliky je možné objednat takovým způsobem, že pro každý vrchol V , jsou kliky s obsahem V následující za sebou v uspořádání.
  • Čárový graf je graf, jehož hrany může být pokryta hran disjunktní klik takovým způsobem, že každý vrchol patří do přesně dva z klik v krytu.
  • Perfektní graf je graf, ve kterém klika číslo rovná barevnost v každém vyvolané subgrafu .
  • Dělená graf je graf, ve kterém některé klika obsahuje alespoň jeden koncový bod každé hrany.
  • Trojúhelník bez graf je graf, který nemá žádné jiné než jeho vrcholů a hran kliky.

Navíc mnoho dalších matematických konstrukcí zahrnuje kliky v grafech. Mezi nimi,

  • Klika komplex grafu G je abstraktní simplicial komplex X ( G ) s simplexní pro každý kliky v G
  • Simplex graf je neorientovaný graf κ ( G ) s vrcholem pro každý kliky v grafu G a okraje spojující dvě kliky, které se liší od jednoho vrcholu. Je to příklad mediánu grafu a je spojen se střední algebrou na klikách grafu: medián m ( A , B , C ) tří klik A , B a C je klika, jejíž vrcholy patří alespoň dva z klik , B a C .
  • Klika součtem je způsob kombinací dvou grafů jejich sloučením podél společné klika.
  • Šířka kliky je pojem složitosti grafu z hlediska minimálního počtu odlišných štítků vrcholů potřebných k sestavení grafu z disjunktních svazků, operací relabelingu a operací, které spojují všechny páry vrcholů s danými popisky. Grafy s klikou o šířce kliky jsou přesně nesouvislými svazky klik.
  • Počet průsečík grafu je minimální počet klik potřebných k pokrytí všech hran grafu.
  • Klika grafu grafu je křižovatka graf svých maximálních klik.

Úzce související pojmy s úplnými podgrafy jsou pododdělení celých grafů a úplných nezletilých grafů . Zejména Kuratowského věta a Wagner teorém charakterizují plošné grafy o zakázaných úplných a kompletní bipartitní třídění a mladistvých, resp.

Počítačová věda

V počítačové vědě je problémem kliky výpočetní problém nalezení maximální kliky nebo všech klik v daném grafu. Je to NP-Complete , jeden z Karpových 21 NP-kompletních problémů . Je také neřešitelný s pevnými parametry a je těžké jej přiblížit . Přesto bylo vyvinuto mnoho algoritmů pro výpočetní kliky, buď běžících v exponenciálním čase (například Bron -Kerboschův algoritmus ), nebo specializovaných na rodiny grafů, jako jsou planární grafy nebo dokonalé grafy, u nichž lze problém vyřešit v polynomiálním čase .

Aplikace

Slovo „klika“ ve svém graficko-teoretickém použití vzniklo z díla Luce & Perryho (1949) , který pomocí kompletních podgrafů modeloval kliky (skupiny lidí, kteří se všichni navzájem znají) v sociálních sítích . Stejnou definici použil Festinger (1949) v článku s použitím méně odborných výrazů. Obě díla pojednávají o odkrývání klik v sociální síti pomocí matic. Pokračující úsilí o teoretické modelování sociálních klik viz např. Alba (1973) , Peay (1974) a Doreian & Woodard (1994) .

Mnoho různých problémů z bioinformatiky bylo modelováno pomocí kliků. Například Ben-Dor, Shamir & Yakhini (1999) modelují problém shlukování dat genové exprese jako jeden z nalezení minimálního počtu změn potřebných k transformaci grafu popisujícího data do grafu vytvořeného jako disjunktní spojení klik; Tanay, Sharan & Shamir (2002) diskutují o podobném problému s dvojitým shlukováním dat exprese, ve kterých musí být klastry kliky. Sugihara (1984) používá kliky k modelování ekologických mezer v potravních sítích . Day & Sankoff (1986) popisují problém odvozování evolučních stromů jako jeden z nalezení maximálních klik v grafu, který má jako své vrcholy charakteristiky druhu, kde dva vrcholy sdílejí hranu, pokud existuje dokonalá fylogeneze kombinující tyto dva znaky. Samudrala & Moult (1998) modelují predikci struktury proteinu jako problém hledání klik v grafu, jehož vrcholy představují polohy podjednotek proteinu. A hledáním kliků v interakční síti protein-protein našli Spirin & Mirny (2003) shluky proteinů, které spolu úzce interagují a mají málo interakcí s proteiny mimo klastr. Analýza výkonových grafů je metoda pro zjednodušení složitých biologických sítí hledáním klik a souvisejících struktur v těchto sítích.

V elektrotechnice , Prihar (1956) používá k analýze kliky komunikační sítě, a Paull & Unger (1959), použít je navrhnout efektivní obvody pro výpočet částečně uvedených logických funkcí. Při generování automatického testovacího vzoru byly použity také kliky: velká klika v grafu nekompatibility možných poruch poskytuje dolní mez velikosti testovací sady. Cong & Smith (1993) popisují aplikaci klik při hledání hierarchického rozdělení elektronického obvodu na menší podjednotky.

V chemii , Rhodes a kol. (2003) používají kliky k popisu chemikálií v chemické databázi, které mají vysoký stupeň podobnosti s cílovou strukturou. Kuhl, Crippen & Friesen (1983) používají kliky k modelování poloh, ve kterých se na sebe navážou dvě chemikálie.

Viz také

Poznámky

Reference

  • Alba, Richard D. (1973), „Graficko-teoretická definice sociometrické kliky“ (PDF) , Journal of Mathematical Sociology , 3 (1): 113–126, doi : 10,1080/0022250X.1973.9989826.
  • Barthélemy, J.-P .; Leclerc, B .; Monjardet, B. (1986), „O používání uspořádaných sad v problémech srovnání a konsensu klasifikací“, Journal of Classification , 3 (2): 187–224, doi : 10.1007/BF01894188 , S2CID  6092438.
  • Ben-Dor, Amir; Shamir, Ron; Yakhini, Zohar (1999), „Clustering Gen Expression Patterns .“, Journal of Computational Biology , 6 (3–4): 281–297, CiteSeerX  10.1.1.34.5341 , doi : 10.1089/106652799318274 , PMID  10582567.
  • Chang, Maw-Shang; Kloks, Ton; Lee, Chuan-Min (2001), „Maximum clique transversals“, Graficko-teoretické koncepty v informatice (Boltenhagen, 2001) , Lecture Notes in Comput. Sci., 2204 , Springer, Berlin, s. 32–43, doi : 10.1007/3-540-45477-2_5 , ISBN 978-3-540-42707-0, MR  1905299.
  • Cong, J .; Smith, M. (1993), „Paralelní shlukovací algoritmus zdola nahoru s aplikacemi pro dělení obvodů v designu VLSI“, Proc. 30. mezinárodní konference Automation Design , s. 755–760, CiteSeerX  10.1.1.32.735 , doi : 10.1145/157485.165119 , ISBN 978-0897915779, S2CID  525253.
  • Den, William HE; Sankoff, David (1986), „Výpočetní složitost odvozování fylogenií podle kompatibility“, Systematická zoologie , 35 (2): 224–229, doi : 10,2307/2413432 , JSTOR  2413432.
  • Doreian, Patrick; Woodard, Katherine L. (1994), „Definování a lokalizace jader a hranic sociálních sítí“, Social Networks , 16 (4): 267–293, doi : 10.1016/0378-8733 (94) 90013-2.
  • Erdős, Paul ; Szekeres, George (1935), „Kombinatorický problém v geometrii“ (PDF) , Compositio Mathematica , 2 : 463–470.
  • Festinger, Leon (1949), „Analýza sociogramů pomocí maticové algebry“, Human Relations , 2 (2): 153–158, doi : 10,1177/001872674900200205 , S2CID  143609308.
  • Graham, R .; Rothschild, B .; Spencer, JH (1990), Ramsey Theory , New York: John Wiley and Sons, ISBN 978-0-471-50046-9.
  • Hamzaoglu, I .; Patel, JH (1998), „Zkušební sada zhutňovacích algoritmů pro kombinační obvody“, Proc. 1998 Mezinárodní konference IEEE/ACM o počítačem podporovaném designu , s. 283–289, doi : 10.1145/288548.288615 , ISBN 978-1581130089, S2CID  12258606.
  • Karp, Richard M. (1972), „Redukovatelnost mezi kombinatorickými problémy“, in Miller, RE; Thatcher, JW (eds.), Complexity of Computer Computations (PDF) , New York: Plenum, str. 85–103, archivováno z originálu (PDF) dne 2011-06-29 , vyvoláno 2009-12-13.
  • Kuhl, FS; Crippen, GM; Friesen, DK (1983), „Kombinatorický algoritmus pro výpočet vazby ligandu“, Journal of Computational Chemistry , 5 (1): 24–34, doi : 10,1002/jcc.540050105 , S2CID  122923018.
  • Kuratowski, Kazimierz (1930), „Sur le problème des courbes gauches en Topologie“ (PDF) , Fundamenta Mathematicae (ve francouzštině), 15 : 271–283, doi : 10,4064/fm-15-1-271-283.
  • Luce, R. Duncan ; Perry, Albert D. (1949), „A method of matrix analysis of group structure“, Psychometrika , 14 (2): 95–116, doi : 10.1007/BF02289146 , hdl : 10.1007/BF02289146 , PMID  18152948 , S2CID  16186758.
  • Měsíc, JW; Moser, L. (1965), „O klikách v grafech“, Israel Journal of Mathematics , 3 : 23–28, doi : 10,1007/BF02760024 , MR  0182577.
  • Paull, MC; Unger, SH (1959), „Minimalizace počtu stavů v neúplně specifikovaných sekvenčních přepínacích funkcích“, IRE Transactions on Electronic Computers , EC-8 (3): 356–367, doi : 10.1109/TEC.1959.5222697.
  • Peay, Edmund R. (1974), „Hierarchical clique structures“, Sociometry , 37 (1): 54–65, doi : 10,2307/2786466 , JSTOR  2786466.
  • Prihar, Z. (1956), "Topologické vlastnosti telekomunikačních sítí", Proceedings of the IRE , 44 (7): 927–933, doi : 10.1109/JRPROC.1956.275149 , S2CID  51654879.
  • Rhodos, Nicholas; Willett, Peter; Calvet, Alain; Dunbar, James B .; Humblet, Christine (2003), „CLIP: vyhledávání podobností 3D databází pomocí detekce kliky“, Journal of Chemical Information and Computer Sciences , 43 (2): 443–448, doi : 10.1021/ci025605o , PMID  12653507.
  • Samudrala, Ram; Moult, John (1998), „Graficko-teoretický algoritmus pro srovnávací modelování proteinové struktury“, Journal of Molecular Biology , 279 (1): 287–302, CiteSeerX  10.1.1.64.8918 , doi : 10.1006/jmbi.1998.1689 , PMID  9636717.
  • Spirin, Victor; Mirny, Leonid A. (2003), „Proteinové komplexy a funkční moduly v molekulárních sítích“, Proceedings of the National Academy of Sciences , 100 (21): 12123–12128, doi : 10,1073/pnas.2032324100 , PMC  218723 , PMID  14517352.
  • Sugihara, George (1984), „Teorie grafů, homologie a potravinové sítě“, v Levin, Simon A. (ed.), Population Biology , Proc. Symp. Appl. Math., 30 , s. 83–101.
  • Tanay, Amos; Sharan, Roded; Shamir, Ron (2002), „Discovering statistically significant biclusters in gen expression data“, Bioinformatics , 18 (Suppl. 1): S136 – S144, doi : 10.1093/bioinformatics/18.suppl_1.S136 , PMID  12169541.
  • Turán, Paul (1941), „O extrémním problému v teorii grafů“, Matematikai és Fizikai Lapok (v maďarštině), 48 : 436–452

externí odkazy