Komentarze

do: A Ty wierzysz w sieć semantyczną?

Dodaj nowy

Najnowsze

Wyróżnione

Śledź przez RSS

Komentarze:

thek (461)
[w odpowiedzi dla: ~kthulu]

Jak dla mnie skruk też tylko wyidealizowaną formę chce widzieć. Aby minimalizować ingerencję, całość działań musiałaby się odbywać bez minimalnej nawet ingerencji człowieka. Wszystko maszynowo. Problem w tym, że tak się nie da. Baza wiedzy zapisana w grafach i ich połączeniach musiałaby być kompletna już na starcie, gdyż każde nowe połączenie może zostać zafałszowane, poprzez co z czasem cały system zacznie działać nieprawidłowo generując obarczone błędami węzły i połączenia między nimi. Ale tak naprawdę nawet wtedy będzie się dało manipulować nimi poprzez coś co będzie odpowiednikiem SEO, a co można by nazwać D/CEO, czyli Data/Content Engine Optimalization. Mogę bowiem zwiększać gęstość określonych słów przez co maszyna uzna całość za coś zupełnie innego niż jest w rzeczywistości. Poza tym jak sobie wyobrażasz wszystkie dane tylko przez maszynę dostarczane? Skąd dowie się ona co jest tytułem co opisem, co autorem? Sięgamy po odpowiednie formatowanie tekstu? No i kupa, bo na to człowiek ma wpływ i może to modyfikować. Pole do nadużyć. To samo przerabiano z div i table w html. Wszystko było cacy aż jakiś koleś nie zauważył, że tabelka służy do prostego układania layoutu strony. Teraz się z tego poważne serwisy i webmasterzy wycofują, ale przez ile lat taki stan rzecz się utrzymywał? Web 3.0 także na takie wariacje będzie wystawiona. W html znaczniki meta stron są niemal kompletnie ignorowane bo ludzie ich nadużywali w sposób niewłaściwy. To samo będzie czekało Web 3.0 po jakimś czasie. Będą musiały reagować na działania spamerskie poprzez inne algorytmy obliczania trafności powiązania danych i modyfikować wagi połączeń. To nadal to co opisałem jako systemy eksperckie wsparte sieciami rozmyto-neuronowymi. Poczytaj po co są sieci rozmyto-neuronowe a sam zobaczysz, że to nic innego niż system analizy i oceny danych, także niekompletnych czy błędnych. To nie jest prosta logika Boole'owska. Rozmyta ma tam swoje znaczenie, gdyż w wyniku otrzymujemy prawdopodobieństwo przynależności do określonych zbiorów, a nie ścisłe określenie prawda-fałsz.

06-05-2010, 09:11

odpowiedz
~kthulu
[w odpowiedzi dla: ~skruk]

Twój opis jest poprawny i nie mam co do niego zastrzeżeń, poza jednym: Dotyczy sytuacji wyidealizowanych i sprawdziłby się gdyby do sieci nie weszła komercja. Zauważ, że nawet głupi html był idealnym "nośnikiem" informacji do czasu, aż ktoś wymyślił reklamy, popupy i cały bajzel związany z przeliczaniem ctr i cpc. Z siecią semantyczną będzie tak samo, będzie się rozwijać do momentu, aż ktoś zauważy, że robiąc "małe" oszustwo można nieźle zarobić. I wtedy cała idea runie (nieważne skąd będą brane metadane). Dlatego moim zdaniem do dobrej sieci semantycznej jest potrzebny sztuczny mózg, który będzie pozbawiony możliwości podkręcania parametrów.

05-05-2010, 14:53

odpowiedz
~janpol

Pietrzak kiedyś powiedział, że komunizm to system, który z dużym poświęceniem i determinacją walczy z przeszkodami, które sam stworzył. Niestety dotyczy to też tego całego bałaganu, jaki powstał po żywiołowym rozwoju Internetu (Google "po mistrzowsku" się w to wpisały, tworząc system przeszukiwania informacji po treści (ja mam dość np. przebijania się przez masę śmieci w czasie poszukiwania czegokolwiek!!! Mogli by wreszcie dołączyć jakiś porządny język zapytań do tego "gnoju" zamiast zajmować się głupotami), włączając to całe WWW/HTML, XML itp. itd. A wystarczyło skupić się i rozwijać to co już było przed Internetem: QUEL, SQL, system gromadzenia i przetwarzania danych (i metadanych) tworzonych np. przez ludzi w Bibliotece Kongresu US. Bylibyśmy dzisiaj znacznie dalej przy tworzeniu systemów eksperckich i inteligentnych sieci danych. Ale widać komuś zależy na tym bałaganie!

05-05-2010, 14:29

odpowiedz
~Grzesiek
[w odpowiedzi dla: ~skruk]

@skruk - Dzięki.

Moim zdaniem OpenGraph to przełom na miarę wyszukiwarki Google. Przed powstaniem Google nikt sobie nie wyobrażał że można skanować całą sieć oraz ją indeksować. Trzeba było ręcznie dodawać każdą stronę do katalogów. Minęło 10 lat i mało kto o tym pamięta.

Dziś mamy kolejny przełom. Zaledwie tydzień temu pojawił się uniwersalny mechanizm opisu semantycznego stron a już ponad 50tyś stron internetowych z niego skorzystało (Facebook podał info na swoim blogu). Za rok większość stron w sieci będzie dokładnie określała swój typ (oraz np. lokalizację) a dziesiątki aplikacji będą z tych danych korzystały.

Kilka przykładów użycia nowego API wrzuciłem na bloga:

http://deepd(...)ego.html

05-05-2010, 14:10

odpowiedz
~skruk
[w odpowiedzi dla: thek]

Grzesiek - info o Open Graph to jak najbardziej celny przyklad tutaj

thek - AI a Semantic Web to dwa rozne sprawy. Patrzysz na sprawe z punktu widzenia ludzi ktorzy mysleli o SW jakies 10 lat temu; i jak sporo uczelni w Polsce nadal na to patrzy. SW to przede wszystkim Web (Science) a nie AI czy Logika.

thek, kthulu - popelniacie podstawowy blad w zalozeniach z jakim sie czesto spotykam. Zakladacie ze metadane nie istnieja i ze musza byc tworzone, i ze najlepsze na co ludzie mogli sie zdobyc to tagowanie.
Nic bardziej mylnego - metadane sa zwiazane ze wszystkim co robimy - w bazach relacyjnych, w naszej skrzynce email, w systemie plikow. Problem jest w tym ze nie sa one polaczone i (czesto) nie sa ujednolicone. Ale wlasnie w tym miejscu wkracza SW i np. Linked Opend Data.

Zapraszam na http://www.semanticschool.com/ po garsc wiedzy przed dalsza dyskusja.

05-05-2010, 13:57

odpowiedz