wtorek, 1 lipca 2008

Indeksowanie SWF w wyszukiwarkach

Interesujący temat ostatnio, czyli sezon ogórkowy. Adobe ogłosiło że razem z Google i Yahoo pozwoli na indeksowanie zawartości tekstowej plików SWF9 (wcześniejsze formaty były indeksowane). Myślę, że tworzenie plików SWF podlegających indeksowaniu to temat rzadko poruszany. Mam własne przemyślenia na ten temat:

  • Od umieszczania zawartości tekstowej były metatagi w formacie SWF, a takze zawartość testowa osadzana w polu tekstowym. Jest to jedyny sposób na trafienie w wynikach Google
  • Obecne zawartość tekstowa w plikach SWF to śmieci. - wystarczy dopisać filetype:swf
Jak sprawić żeby zawartość plików SWF nie była "koszmarem"? Należy zrobić pliki SWF z pełna zawartością tekstową bez formatowania. A formatowanie zawartości pozostawić skryptom Action Script i plikom CSS. W ten sposób unikniemy indeksowania takiej zawartości typu: font face="Tahoma" size="12" color="#ffffff" letterSpacing="-0.100000" kerning="0"

W przypadku gdy mamy na stronie zawartość pliku SWF tworzonego przy pomocy Flex/Haxe to trzeba dodać bardzo dokładnie opisujące. A nawet jest to jest opisane w dokumentacji

Kolejna sprawa to pewien paradoks tkwiący w tym że, Adobe powinno było stworzyć rozwiązanie dzięki któremu wyszukiwarki "odsiewały" plewy od ziarna. Ta technologia już była: nazywa się FlashPaper. Nawet można już ładnie wyszukać pliki z dokumentami FlashPaper

Pozostaje teraz dość interesująca sytuacja dzięki temu że powstają konwertery online na format SWF w takich usługach jak Media Convert, ale to nie ułatwia sprawy, jeżeli chodzi o indeksowanie plików SWF , bo aplikacje RIA coraz bardziej przypominają aplikacje Ajax. A te wymagają stworzenia właściwej interakcji pomiędzy treścią na stronie WWW, a nawigacją w aplikacji AJAX/RIA.

Idealna sytuacja to taka w której serwis został tak zaprojektowany że na każdy "widok" aplikacji odpowiada odpowiedni dokument FlashPaper, który zresztą może zostać załadowany "wewnątrz" aplikacji RIA. W ten sposób załatwiamy prawie wszystkie bolączki aplikacji RIA:
  • Google ładnie indeksuje pliki SWF z FlashPapera
  • Użytkownik otrzymuje dokument SWF przystosowany do druku
  • Prawie wszędzie można odczytać dokumenty FlashPapera (nawet w FlashLite)
  • Pliki z FlashPaper są przyjazne screenreaderom
  • po "shackowaniu" API FlashPaper jest możliwa komunikacja z innymi aplikacjami RIA/Ajax

4 komentarze:

zwolu pisze...

Jeśli ten news się potwierdzi to Internet czeka mała rewolucja. Należało się tego spodziewać prędzej czy później. (X)HTML jeszcze długo nie przejdzie do lamusa, ale klienci coraz częściej będą sięgać po rozwiązania a la Flash. Do tej pory trzeba było stanąć przed wyborem albo fajna ciekawa strona albo wyszukiwarki. Kiedy różnica się zatrze jedynymi ograniczeniami będzie wyobraźnia twórców :)

Michał gratulacje za wyróżnienie na Adobe Air Tour, nie miałem jeszcze okazji :)

Michał Małaj pisze...

@zwolu - dziękuję za gratulacje. Jakoś nie bardzo chce mi się wierzyć żeby roboty sieciowe bawiły się w dekompilację SWF. Aplikacje Flex to prawie sam kod ActionScript. A używanie FlashPapera, to na dzień dzisiejszy jest postrzegane jako coś zbędnego.

Peper pisze...

Indeksowanie stron poprzez rozbieranie SWF'a nie ma sensu. Nie kojarzę kiedy ostatnio robiłem stronę, która miała zahardkodowany konrent. Wszyscy klienci chcą stronki na CMS. "Podglądanie" tego co idzie po AMF byłoby jakąś możliwością, ale nie wiadomo jak to interpretować.

Do tej pory indeksowanie stron Flashowych wymagało paru trików, ale się udaje ogólnie.
np. google: piccaro+diesel
nie zrobiliśmy tam deep linking, ale nawet jak wyniki prowadzą do strony głównej to już jest nieźle.

Uważam, że rozwiązaniem jest tu świadome przygotowywanie przez programistów jakiegoś interfejsu dla wyszukiwarek. Jakejś mapy strony w ustalonym formacie z informacjami do indeksowania każdej podstrony + linkami (zakładam tu deep linking). Ewentualnie wykorzystanie Automation do tego, żeby robot "przeklikał" się przez stronę.

Devu pisze...

A ja uderze z innej strony. Na fali protestow internautow z UK na temat szpiegowania uzytkownikow sieci.

Generalnie od ponad 3lat jak mi ktos mowil ze nie da sie wypozycjonowac flasha mialem okazje popisac sie swoja wiedza i zawsze bawilo mnie jak zmieniala sie mina klienta kiedy z sarkazmem zalewalem go argumentami. I ten fakt ze trzeba bylo jednak uciekac sie to sztuczek, kombinacji, deep linking, itp by to osiagnac moze irytowal ale pozostawial nam wybor "show or hide"

Poszukajcie sobie o czym sie teraz mowi jak to wielkie firmy tego swiata nas szpieguja. Pharm, BT, Virgin. Ciekawe czy dziadkom czytano poczte, albo zagladali przez okno w jakich skarpetkach i kiedy chodzi do lazienki.

Caly swiatek deceloperski dazy do unifikacji i standaryzacji, wszystko co sie wylamywalo jest be. Sami developerzy powtarzaja w kolko slogany jak by chcieli pokazac ze jesli moj kod jest validate to ja sam jestem guru nie zastanawiajac sie nad tym czy moze komus zalezy na tym by tak bylo. Zaczynam sie zastanawiac czy akcja "pisz poprawnie po polsku w sieci"
nie jest wymyslona przez programistow piszacych roboty do tego by wiedziec co lubi nasza mlodziez... gdybam sobie teraz oczywiscie ale;

W tym kontekscie ciesze sie ze flash jest niewidzialny i moze jest to ostatnia wolna platforma w sieci... jeszcze. I takie info nie napawa mnie radascia. Osobicie wolalbym spedzic wiecej czasu na dodaniu tej funkcjonalnosci w projektach flash ale wciaz miec wybor.