Wprowadzenie do standardu XSL

Transkrypt

Wprowadzenie do standardu XSL
Wprowadzenie do standardu XSL
Tomasz Przechlewski
2002
Spis treści
1 Wprowadzenie
1
2 XPath
2.1 Wstęp . . . . . . . . . . . . .
2.2 Ścieżki dostępu . . . . . . . .
2.2.1 Osie . . . . . . . . . .
2.2.2 Testy węzłów . . . . .
2.2.3 Predykaty . . . . . . .
2.2.4 Składnia uproszczona
2.3 Wyrażenia . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
4
4
6
7
8
9
3 XSLT
3.1 Wprowadzenie . . . . . . . . . .
3.2 Arkusz stylu . . . . . . . . . . .
3.3 Szablony . . . . . . . . . . . . . .
3.4 Tworzenie drzewa wyjściowego
3.5 Generowanie tekstu . . . . . . .
3.6 Numerowanie . . . . . . . . . . .
3.7 Zmienne . . . . . . . . . . . . . .
3.8 Iteracje . . . . . . . . . . . . . . .
3.9 Przetwarzanie warunkowe . . .
3.10 Sortowanie . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
11
12
14
15
15
16
17
17
18
1
.
.
.
.
.
.
.
Wprowadzenie
Do wizualizacji dokumentu potrzebujemy w zasadzie dwóch elementów:
1. sposobu opisu wyglądu dokumentu docelowego,
1
2
2 XPATH
2. metody przekształcenia znakowania ogólnego dokumentu wyjściowego
na znakowanie zorientowane na prezentację dokumentu docelowego.
Standard XSL adresuje właśnie te dwa aspekty formatowania. Na XSL składają się obecnie trzy rekomendacje konsorcjum W3C:
XSLT część związana z przekształcaniem dokumentów XML,
XPath część związana z adresowaniem elementów dokumentu XML,
FO część związana ze specyfikacją standardowych obiektów formatujących.
Po pierwsze jedna ze specyfikacji definiuje język XMLowy do specyfikowania
samego sposobu formatowania elementów w druku bądź w przeglądarce,
druga opisuje język przekształcania dokumentów XML w inne dokumenty
XML natomiast trzecia definiuje język adresowania elementów dokumentu
XML.
Elementy definiujące semantykę samego formatowania są nazywane
„obiektami formatującymi” (formatting objects, w skrócie fo). XSLowe
obiekty formatujące są opisane w specyfikacji [6].
Odłączenie języka przetwarzania XSLT od samego języka specyfikującego formatowanie pozwoliło na użycie również innych sposobów wizualizacji
dokumentów niż tylko poprzez obiekty formatujące XSL.
Rolę tych obiektów może spełnić na przykład HTML, który w połączeniu z możliwościami współczesnych programów interpretująych ten format
zapewnia całkiem spore możliwości prezentacyjne. Alternatywą jest skorzystanie z własnych „obiektów formatujących”.
2 XPath
2.1 Wstęp
Dokument XML może być przedstawiony jako struktura drzewiasta. Drzewo
dokumentu jest podstawową strukturą, którą przetwarza język XSLT. Szczegółowy model dokumentu XML jako drzewa jest opisany w rekomendacji
[5].
W drzewie dokumentu znajdują się węzły 7 typów, a mianowicie
(por. rys 1):
korzeń ten węzeł jest jeden dla każdego dokumentu, jego dzieckiem jest
węzeł elementu głównego,
element węzeł odpowiada elementowi, jego dziećmi mogą być węzły elementowe, tekstowe, instrukcje przetwarzania, atrybuty, komentarze
i przestrzenie nazw.
3
2.1 Wstęp
<?xml version="1.0" encoding="iso-8859-2"?>
<Memo status="secret">
<To>Comrade Napoleon</To>
<From>Snowball</From>
<Body>
<P>George Orwell says:
<!-- In Animal Farm if you don’t knoww -->
<Q author=’Orwell’>...the pigs had to
expend enormous labour every day upon mysterious things called files, reports,
minutes and memoranda. These were large sheets of paper which had to be closely
converted with writing, and as soon as they were so converted, they were
burnt in the furnace...</Q>. Do you think XML would have helped the pigs?
</P>
<!-- Add something on XSL -->
</Body>
<Close>Comrade Snowball</Close>
<?xyz rpq?>
</Memo>
root
memo
to
from
Comrade Napoleon
status
Snowball
Geore Orwell... Do you...
...the pigs...
body
close
comment
p
Comrade Snowball
q
comment
pi
author
Rysunek 1: Model dokumentu
tekst węzeł odpowiada fragmentowi tekstu w dokumencie, nie może mieć
węzłów potomnych,
4
2 XPATH
komentarz węzeł zawiera tekst komentarza, nie może mieć węzłów potomnych,
instrukcja sterująca węzeł zawiera tekst instrukcji sterującej.
atrybut węzeł zawierający wartość atrybutu.
przestrzeń nazw węzeł zawierający przestrzeń nazw.
Podstawową konstrukcją standardu XPath jest wyrażenie. Podstawowe
typy danych, to: zbiór-węzłów (node set), logiczny (prawda-fałsz), liczba oraz
napis (ciąg znaków).
Wyrażenie jest obliczane w bieżącym kontekście. Kontekst w jakim są
obliczane wyrażenia XPath jest określony w specyfikacjach XSLT oraz XPointer. Na kontekst składają się: bieżący węzeł, bieżąca pozycja i bieżąca wielkość, zbiór wartości zmiennych, zbiór definicji funkcji, zbiór
deklaracji przestrzeni nazw.
2.2 Ścieżki dostępu
Ważnym typem wyrażenia jest ścieżka dostępu. Wyrażenie XPATH jest
zapisywane w postaci ścieżki dostępu do adresowanych węzłów zapisanej
w postaci poszczególnych kroków oddzielonych znakiem /.
Kroki są obliczane od lewej do prawej. Każdy krok wybiera zbiórwęzłów; pierwszy krok wybiera zbiór-węzłów względem węzeł bieżącego, kolejne kroki za węzeł bieżący przyjmują sekwencyjnie wybrane
węzły ze zbioru otrzymanego w poprzednim kroku.
Jeżeli ścieżka dostępu zaczyna się od znaku / to oznacza to, że rozpoczynamy nawigację od korzenia dokumentu.
Jeżeli zaczyna się od znaków // to oznacza, że możemy rozpocząć nawigację gdziekolwiek w dokumencie.
Jeśli zaczynamy ścieżkę krokiem, to nawigacja zaczyna się w bieżącym
węźle drzewa.
Najprostszy zapis kroku, to podanie nazwy elementu, do którego chcemy
się przemieścić. Tak więc zapis info/tytul oznacza, że chcemy wybrać
tylko te elementy <tytul>, które są dziećmi elementu <info>.
W przypadku gdy do jednego węzła pasuje więcej niż jeden wzorzec,
transformator rozstrzyga, który szablon użyć stosując reguły priorytetowe.
Mówią one między innymi, że szablon przyporządkowany do wzorca bardziej
szczegółowego ma pierwszeństwo nad wzorcem bardziej ogólnym.
2.2.1 Osie
XPATH pozwala na nawigację również po innych tak zwanych osiach.
W ogólnym przypadku krok ma postać oś::test węzła[predykat].
2.2 Ścieżki dostępu
5
Osie, po których możemy się poruszać to:
• oś dzieci (child) zawierająca węzły bezpośrednio doczepione w drzewie do węzła bieżącego;
• oś potomków (descendant) zawierająca węzły leżące w drzewie poniżej bieżącego;
• oś rodzica (parent) zawierająca węzeł, do którego węzeł bieżący jest
bezpośrednio doczepiony, jeżeli takowy istnieje;
• oś przodków (ancestor) zawierająca węzły położone w drzewie powyżej węzła bieżącego;
• oś sąsiadów z tyłu (following-sibling), tj. wszystkie węzły mające
tego samego rodzica, które znajdują się „za” bieżącym;
• oś sąsiadów z przodu (proceeding-sibling), tj. wszystkie węzły mające tego samego rodzica, które znajdują się „przed” bieżącym;
• oś poprzedników (preceding), tj. wszystkie węzły w dokumencie
znajdujących się „przed” bieżącym;
• oś następników (following), tj. wszystkie węzły w dokumencie znajdujących się „za” bieżącym;
• oś atrybutów zawierająca atrybuty węzła bieżącego; oś ta jest pusta
jeżeli bieżącym węzłem nie jest element;
• oś przestrzeni nazw zawierająca przestrzenie nazw zadeklarowane
dla węzła bieżącego; oś ta jest pusta jeżeli bieżącym węzłem nie jest
element;
• oś węzła bieżącego (self );
• oś potomków i oś węzła bieżącego (descendant-or-self ), tj. węzeł
bieżący i węzły leżące w drzewie poniżej bieżącego;
• oś rodziców i oś węzła bieżącego (ancestor-or-self ), tj. węzeł bieżący i węzły leżące w drzewie powyżej bieżącego.
Osie ancestor, descendant, following, preceding i self dzielą dokument
w ten sposób, że nie nakładają się na siebie i razem zawierają cały dokument
(pomijając osie atrybutów i przestrzeni nazw, por. rys. 2).
Każdy krok może zostać zapisywany w postaci oś ::test [predykat ],
gdzie: test specyfikuje wybrane węzły na danej osi zaś predykat określa
dodatkowe warunki, które muszą spełniać węzły.
6
2 XPATH
root
memo
to
...
from
...
body
p
...
close
p
...
p
q
...
...
...
Rysunek 2: Osie
2.2.2 Testy węzłów
Każda oś posiada podstawowy typ węzła (principal node type). Jeżeli
oś zawiera elementy, to podstawowym typem węzła jest element; w każdym innym przypadku jest to typ węzła, który może zawierać oś, tj.: atrybut
i przestrzeń nazw odpowiednio dla osi atrybutów i osi przestrzeni nazw oraz
element dla pozostałych typów osi.
Test zawierający nazwę węzła (tj. nazwę elementu, atrybutu, przestrzeni nazw) zwraca wartość prawda tylko wtedy, gdy typ tego węzła jest równy podstawowemu typowi węzła osi oraz nazwa węzła jest równa nazwie
wyspecyfikowanej w teście. Przykładowo: child::para wybiera elementy
<para> będące dziećmi węzła bieżącego.
Test postaci * jest prawdziwy dla każdego węzła, którego typ jest zgodny
z podstawowym typem węzła osi. Przykładowo: child::* wybierze wszyst-
2.2 Ścieżki dostępu
7
kie elementy-dzieci węzła bieżącego, zaś attribute::* wybierze wszystkie
atrybuty węzła bieżącego.
Testy postaci text(), comment() i processing-instruction() są prawdziwe odpowiednio dla każdego: węzła tekstowego, komentarza oraz instrukcji formatującej. Przykładowo: child::text() oznacza węzły tekstowe węzła bieżącego.
Opcjonalnym argumentem testu processing-instruction może być napis; w takim przypadku test jest prawdziwy dla instrukcji formatującej o nazwie równej wartości argumentu.
Jeśli chcemy wybrać wszystkie węzły (również te tekstowe, z komentarzami itp.) należy podać jako test węzła funkcję node(). Przykładowo, aby
zaadresować wszystkie węzły potomne od elementu <spis> należy zapisać
wyrażenie self::spis/descendant::node().
2.2.3 Predykaty
Ostatnim elementem kroku może być predykat. Jest on zapisywany w nawiasach kwadratowych i podaje warunek, który powinien być spełniony
przez wybierany węzeł.
Oś może być albo osią „w przód” albo w „tył”. Oś zawierająca węzeł
bieżący oraz węzły występujące po nim w porządku dokumentu jest osią
„w przód”. Oś zawierająca węzeł bieżący i węzły występujące przed nim
w porządku dokumentu jest osią „w tył”.
Osie: ancestor, ancestor-or-self, preceding i precendig-sibling są „w tył”;
pozostałe osie są osiami „w przód”.
Węzły w zbiorze-węzłów wybranym względem danej osi są uporządkowane w porządku w jakim występują w dokumencie jeżeli oś jest osią
„w przód” lub w porządku odwrotnym do tego w jakim występują w dokumencie jeżeli oś jest osią „w tył”. Numer pierwszego węzła wynosi 1.
Dla każdego węzła w zbiorze-węzłów wybranym według osi i testu obliczany jest warunek predykatu, przy założeniu, że tenże węzeł jest węzłem bieżącym, bieżącą wielkością (context size) jest liczba węzłów
w zbiorze-węzłów a bieżącą pozycją (context position) jest numer węzła
określonemu w sposób podany w poprzednim akapicie.
Jeżeli wyrażenie zwraca wartość prawda węzeł jest wybierany do wynikowego zbioru-węzłów; w przeciwnym wypadku nie jest.
Jeżeli wyrażenie podane w predykacie wylicza się do liczby, to jest to
interpretowane jako test położenia węzła w stosunku do jego sąsiadów. Na
przykład 5 element <para> w trzecim elemencie <chapter> możemy zaadresować jako chapter[3]//para[5].
W każdym innym przypadku wyrażenie jest konwertowane do wartości
boolowskiej. Na przykład wszystkie elementy <w> zawierające element <i>
możemy wyszukać wzorcem w[./i].
8
2 XPATH
2.2.4 Składnia uproszczona
Specyfikacja osi child:: może zostać pominięta, tj. div/para jest równoważne child::div/child::para.
Specyfikacja osi attribute:: może zostać skrócona do @. Przykładowo:
para[@lang="pl"] jest równoważne: child::para[attribute::lang="pl"].
Specyfikacja //, to skrót od /descendant-or-self::node()/
Specyfikacja ., to skrót od self::node()
Specyfikacja .., to skrót od parent::node()
Przykłady:
• para wybiera elementy <para> – dzieci węzła bieżącego;
• * wybiera wszystkie elementy – dzieci węzła bieżącego;
• text() wybiera wszystkie elementy tekstowe – dzieci węzła bieżącego;
• @name wybiera atrybut name będący dzieckiem węzła bieżącego;
• @* wybiera wszystkie atrybuty będące dziećmi węzła bieżącego;
• para[1] wybiera pierwszy element <para> będący dzieckiem węzła
bieżącego;
• para[last()] wybiera ostatni element <para> będący dzieckiem węzła bieżącego;
• /article/chapter[4]/section[2] wybiera drugi element <section>
dziecko czwartego elementu <chapter> dziecko elementu <article>;
• chapter//para wybiera wszystkie elementy <para> będące potomkami elementu <chapter>;
• //para wybiera wszystkie elementy <para> będące potomkami korzenia dokumentu, tj. wszystkie elementy <para> w dokumencie;
• . wybiera bieżący węzeł;
• .//para wybiera wszystkie elementy <para> będące potomkami węzła bieżącego;
• .. wybiera rodzica węzeła bieżącego;
• ../@lang wybiera atrybut lang rodzica węzeła bieżącego;
• para[@type=’warning’] wybiera wszystkie elementy <para>, dzieci elementu bieżącego, dla których wartość atrybutu type wynosi
warning.
2.3 Wyrażenia
9
• para[@type=’warning’][5] z elementów <para>, dzieci elementu bieżącego, dla którego wartość atrybutu type wynosi warning wybiera
piąty.
• para[5][@type=’warning’] wybiera piąty element <para>, dziecko
elementu bieżącego jeżeli wartość atrybutu type dla tego elementu
wynosi warning.
• para[position()=5 and @type=’warning] to samo co wyżej.
• danie[nazwa=’zupa pomidorowa’] wybiera te elementy danie, dzieci elementu bieżącego, dla których napisową wartością elementu
<nazwa>, które z kolei jest dzieckiem elementu <danie> – jest zupa pomidorowa.
2.3
Wyrażenia
Ścieżka dostępu może zostać użyta jako wyrażenie. Wyrażenie zwraca zbiórwęzłów.
Możliwe jest tworzenie wyrażeń logicznych za pomocą operatorów: =,
!=, <, >=, <= oraz łączenie wyrażeń logicznych za pomocą operatorów and
oraz or.
Możliwe jest tworzenie wyrażeń logicznych za pomocą operatorów: +, -,
*, div, mod.
Zdefiniowane są następujące funkcje:
last() zwraca wielkość bieżącą (context size).
position() zwraca bieżącą pozycję (context position).
count(zbiór-węzłów) zwraca liczbę węzłów argumentu zbiór-węzłów.
id(obiekt) zwraca węzeł o wartości atrybutu typu ID równej wartości argumentu obiekt. Jeżeli obiekt jest napisem, to ten napis jest porównywany z wartością atrybutu ID; jeżeli napis zawiera odstępy to jest
traktowany jako zbiór wartości ID a w rezultacie zwrócony może zostać zbiór-węzłów. W przypadku innych typów obiektów dokonywana
jest odpowiednia konwersja. Szczegóły znajdują się w specyfikacji.
local-name(zbiór-nazw?) zwraca nazwę (bez prefiksa przestrzeni nazw)
pierwszego elementu w podanym zbiorze-nazw.
name(zbiór-nazw?) zwraca pełną nazwę elementu.
string(obiekt?) konwertuje obiekt do napisu. Konwersja zbioru-węzłów polega na zamianie na napis pierwszego węzła ze zbioru przy przyjęciu
porządku w jakim węzły występują w dokumencie.
10
2 XPATH
concat(s1, s2, s3*) łączy napisy w jeden.
start-with(s1, s2) zwraca prawda jeżeli s1 rozpoczyna się od s2.
contains(s1, s2) zwraca prawda jeżeli s1 zawiera s2.
substring-before(s1, s2) zwraca napis wycięty z s1, poprzedzający pierwsze wystąpienie s2 w s1.
substring-after() zwraca napis wycięty z s1, następujący po pierwszym
wystąpieniu s2 w s1.
substring(s1, n1, n2?) zwraca napis wycięty z s1, od pozycji n1 do pozycji
n2, lub do końca napisu, jeżeli nie podano n2. Numer pierwszego znaku
to 1.
string-length(s?) zwraca długość argumentu. Jeżeli argument jest pominięty, zwraca długość bieżącego węzła po konwersji do napisu.
normalize-space(s?) Zwraca napis po usunięciu wiodących i końcowych
znaków odstępu oraz zamianie kolejnych znaków odstępu na pojedynczy znak spacji. Jeżeli argument jest pominięty, zwraca długość bieżącego węzła po konwersji do napisu.
translate(s1,s2,s3) Funkcja podobna w działaniu do standardowego polecenia tr systemu Unix: w napisie s1 wymienia każdy znak wymieniony
w napisie s2 na odpowiadający mu znak w napisie s3.
boolean(obiekt) zamienia obiekt na typ boolowski.
true() zwraca wartość prawda.
false() zwraca wartość fałsz.
lang(s) zwraca wartość prawda jeżeli wartość atrybutu xml:lang węzła
bieżącego jest równa s.
number(obiekt?) zamienia obiekt na liczbę.
sum(zbiór-węzłów) zwraca sumę zawartości zbioru-węzłów po ich konwersji do liczby.
floor(liczba) zwraca największą liczbę całkowitą nie większą od liczba.
ceiling(liczba) zwraca najmniejszą liczbę całkowitą nie mniejszą niż liczba.
round(liczba) Zwraca przybliżenie całkowite argumentu liczba.
11
3
3.1
XSLT
Wprowadzenie
Opis sposobu przetwarzania dokumentu jest określony w arkuszu stylu (stylesheet).
Plik musi być dobrze uformowanym plikiem XMLowym – tzn. musi zaczynać się deklaracją XMLową, a wszystkie znaczniki początku elementu
muszą posiadać sparowane znaczniki końca.
W arkuszu stylu mogą znaleźć się dwa rodzaje elementów. Jedne elementy opisują logikę przetwarzania dokumentu, drugie natomiast, zwane elementami wynikowymi, są elementami, które zostaną wstawione do drzewa
dokumentu wyjściowego. Aby procesor mógł poprawnie rozróżnić jedne elementy od drugich, elementy opisujące przetwarzanie należą do przestrzeni
nazw związanych ze standardem XSLT. W praktyce oznacza to, że zwyczajowo poprzedza się te elementy przedrostkiem xsl:, który jest przyporządkowany odpowiedniej przestrzeni nazw XML na jednym z głównych elementów.
Ponadto, elementy z przestrzeni nazw XSLT mogą posiadać atrybuty
spoza tej przestrzeni, ale takie atrybuty muszą być związane z niepustą
przestrzenią nazw. Dla procesorów rozpoznających daną przestrzeń nazw
takie atrybuty mogą stanowić mechanizm rozszerzający funkcjonalność; muszą być natomiast ignorowane przez procesory XSLT nie rozpoznające danej
przestrzni nazw;
Arkusz stylów składa się z wielu szablonów (template) Szablon pełni dwie funkcje: określa wzorzec pasujący do pewnego fragmentu drzewa
wejściowego dokumentu XML oraz określa strukturę wyjściowego drzewa
elementów
Na różnych etapach przetwarzania procesor XSLT usiłuje dobrać do konkretnego węzła dokumentu najbardziej szczegółowo opisujący go wzorzec
zapisany w arkuszu stylów, a następnie wykonać szablon skojarzony z przyporządkowanym wzorcem.
Wykonanie szablonu odbywa się zawsze w kontekście bieżącego węzła
oraz bieżącej listy węzłów.
3.2
Arkusz stylu
Arkusz stylu jest zawarty wewnątrz elementu <xsl:stylesheet>. Wewnątrz
<xsl:stylesheet> wystąpić mogą następujące elementy: <xsl:output>,
<xsl:variable>, <xsl:param>, <xsl:template> oraz kilka innych.
Jednym z pierwszych elementów w arkuszu powinien być element
<xsl:output>, którego atrybut method będzie zawierał informację o formacie pliku wyjściowego. Ma to wpływ na sposób zapisywania i formatowa-
12
3 XSLT
nia pliku wyjściowego. Atrybut ten przyjmuje wartość html, jeśli wynikiem
transformacji ma być dokument HTML, xml, jeśli tworzymy nową wersję
dokumentu XML lub text jeżeli wynikiem przekształcenia ma być zwykły
plik tekstowy.
Struktura arkusza stylów może zostać przedstawiona następująco:
<?xml version="1.0"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform" >
<xsl:output method="html"/>
<xsl:template match="..."> ... </xsl:template>
<xsl:template name="..."> ... </xsl:template>
</xsl:stylesheet>
Używając dodatkowych atrybutów elementu <xsl:output> możliwe jest
bardziej precyzyjne określenie formatu wyjściowego, np:
<xsl:output method="html" encoding="iso-8859-2"
doctype-public="-//W3C//DTD HTML 4.01 Transitional//EN"
saxon:character-representation="native;decimal"
xmlns:saxon="http://icl.com/saxon" />
Atrybut encoding określa kodowanie pliku wynikowego (w tym wypadku
ISO-8859-2). Atrybut doctype-public określa, że dokument ma być oznaczony publiczną deklaracją DOCTYPE wyspecyfikowaną jako wartość tego
atrybutu.
Sposób reprezentacji znaków jest nieustalony: w zależności od używanego procesora (wspierającego kodowanie jednobajtowe) można oczekiwać
reprezentacji „naturalnej”, encji ogólnych postaci &zacute; lub encji znakowych &#123.
Atrybut character-representation w przykładzie powyżej nie pochodzi z przestrzeni nazw XSLT, ale jest związany z popularnym procesorem XSLT saxon, który pozwala na dokładne określenie reprezentacji
drukowanych znaków. Taki atrybut jest legalny (por. punkt 3.1); wartość
native;decimal określa, że znaki reprezentowane w standardzie ISO-8859-2
będą zapisane „naturalnie” a pozostałe jako encje znakowe.
3.3 Szablony
Pojedynczy szablon jest zapisany we wnętrzu elementu <template>.
W atrybucie match podaje się wzorzec adresujący węzeł, do którego
dany szablon ma być stosowany.
Załóżmy, że plik katalog.xml ma następującą prostą strukturę:
3.3 Szablony
13
<katalog>
<czesc id="c8934" typ="klamkomanetka" rys="chorus43.jpg">
<nazwa>Campagnolo Chorus</nazwa>
<cena>585</cena>
</czesc>
<czesc id="c1293" typ="piasta.tyl" rys="veloce91.jpg">
<nazwa>Campagnolo Veloce</nazwa>
<cena>245</cena>
</czesc>
...
wtedy następujący szablon:
<xsl:template match="nazwa">
<div class="nc">
<xsl:apply-templates/>
</div>
</xsl:template>
spowoduje wydrukowanie:
<div class="nc">Campagnolo Chorus</div>
<div class="nc">Campagnolo Veloce</div>
We wnętrzu szablonu znajduje się element <xsl:apply-templates>, który
jest poleceniem dla procesora XSLT by w to miejsce wstawić wynik przetwarzania węzłów, będących dziećmi węzła bieżącego lub – jeżeli element
<xsl:apply-templates> posiada atrybut select – zbioru węzłów określonych przez wartość tego atrybutu. Wartością atrybutu jest wyrażenie dające
w wyniku zbiór-węzłów.
Szablony przekształcają fragmenty drzewa wejściowego na fragmenty
drzewa wynikowego. Pojedyncze szablony mogą przekształcać dowolne fragmenty drzewa wejściowego.
Ta rekurencyjna metoda pozwala na zapisanie przetwarzania w postaci szablonów zależnych jedynie od kontekstu danego węzła, a nie wiedzy
o pełnej strukturze dokumentu.
W ogólnym przypadku szablon zawiera tekst powielany literalnie do
drzewa wynikowego oraz polecenia XSLT wykonywane przez procesor
XSLT (takie jak <xsl:apply-templates>).
Jeśli procesor nie potrafi dopasować konkretnego wzorca z arkusza stylu,
wtedy do transformacji stosuje wzorzec domyślny. Dla węzłów tekstowych
domyślny szablon wpisuje w drzewo wynikowe tekst będący wartością węzła. Dla węzłów elementowych natomiast szablon domyślny zawiera jedynie
element <xsl:apply-templates>, czyli polecenie „przetwórz wszystkie węzły potomne”.
14
3 XSLT
Element <xsl:call-template> wykonuje szablon nazwany uprzednio
za pomocą polecenia <xsl:template> z określonym atrybutem name. Nazwane szablony mogą być sparametryzowane i wykonywane dla różnych
wartości parametrów.
Załóżmy, że części rowerowe mają być formatowane wewnątrz elementu <div>, którego atrybut class ma dla części droższych niż 100 zł wartość
normalna, a dla pozostałych części wartość tania. Poniższy arkusz rozwiązuje ten problem, wykorzystując szablon nazwany i parametr cc:
<xsl:template name="cz">
<xsl:param name="cc">tania</xsl:param>
<div class="{$cc}"> <xsl:apply-templates/> </div>
</xsl:template>
<xsl:template match="czesc[cena&gt;100]">
<xsl:call-template name="cz">
<xsl:with-param name="cc">normalna</xsl:with-param>
</xsl:call-template>
</xsl:template>
<xsl:template match="czesc">
<xsl:call-template name="cz">
<xsl:with-param name="cc">tania</xsl:with-param>
</xsl:call-template>
</xsl:template>
3.4 Tworzenie drzewa wyjściowego
Szablon przepisuje literalnie elementy, które nie należą do przestrzeni nazw
XSLT oraz nie są zadeklarowanymi niestandardowymi elementami XSLT.
Element może zostać utworzony za pomocą polecenia <xsl:element>. Nazwa elementu wyjściowego jest wartością wymagalnego atrybutu name. Atrybut ten może zawierać wyrażenia XPath, umieszczone wewnątrz nawiasów
klamrowych (por. punkt 3.5).
Element <xsl:attribute> umożliwia wstawienie atrybutu dla elementu
wyjściowego utworzonego zarówno przez literalne przepisanie elementu jak
i poprzez wykorzystanie polecenia <xsl:element>. Nazwę atrybutu określa
wymagalny atrybut name, wartość atrybutu jest określona przez zawartość
elementu <xsl:attribute>. Przykład:
<xsl:template match="doc">
<body>
<attribute name="lang">pl</attribute>
3.5 Generowanie tekstu
15
<apply-templates />
</body>
</xsl:template>
Element <xsl:text> umożliwia wstawienie napisu; element ten jest stosowany najczęściej do wstawiania odstępów, gdyż odstępy wstawiane literalnie
są domyślnie ignorowane.
3.5
Generowanie tekstu
Przetworzenie elementu <xsl:value-of> powoduje wstawienie węzła tekstowego do drzewa wynikowego. Element <xsl:value-of> posiada wymagalny atrybut select, którego wartością jest wyrażenie; wyrażenie jest przekształcane a wynik przekształcenia jest konwertowany do napisu.
Poniższy szablon wydrukuje zestawienie postaci typ: nazwa-części z pliku katalog.xml:
<xsl:template match=’czesc’>
<xsl:value-of select="@typ"/>
<xsl:text>: </xsl:text>
<xsl:value-of select="nazwa"/>
</xsl:template>
W atrybucie elementu wynikowego oraz niektórych elementów XSLT
może być wstawione wyrażenie XPath umieszczone wewnątrz pary nawiasów klamrowych {...}, które w takiej sytuacji podlega normalnemu przekształceniu, tj. {wyrażenie} jest zamieniane na skonwertowany do napisu
wynik przekształcenia. Przykład:
<xsl:template match=’czesc’>
<img src="{@rys}" alt="{nazwa}"/>
</xsl:template>
Przetworzenie pliku katalog.xml przy wykorzystaniu powyższego szablonu
spowoduje wydrukowanie:
<img src="chorus43.jpg" alt="Campagnolo Chorus">
...
Jeżeli wewnątrz wartości atrybutu ma zostać wstawiony literalnie prawy lub
lewy nawias klamrowy należy wstawić dwa takie znaki, tj. {{ lub }}.
3.6
Numerowanie
Element <xsl:number> służy do wstawienia sformatowanego numeru węzła
do drzewa wynikowego. Atrybut count określa węzły, które są numerowane;
domyślnie są to wszystkie węzły tego samego typu i nazwy co węzeł bieżący.
16
3 XSLT
Atrybut format określa format drukowanego numery. Atrybut ten to napis zawierający specyfikacje-formatu i znaki-przestanowe. Specyfikacje
formatu określają postać drukowanej liczby, znaki-przestankowe są przepisywane literalnie. Specyfikacje formatu mają postać ciągów znaków alfanumerycznych; zdefiniowane wartości to m.in:
1 numeracja arabska, tj.: 1, 2, itd;
a numeracja postaci: a, b, itd;
A numeracja postaci: A, B, itd;
i kolejne liczby rzymskie: i, ii, iii, iv, itd;
I kolejne liczby rzymskie: I, II, III, IV, itd.
Numer elementu może być obliczany za pomocą wyrażenia umieszczonego w atrybucie value. Wartość wyrażenia jest konwertowana do liczby
całkowitej, a następnie wypisywana jest napisowa reprezentacja tej liczby.
Jeżeli nie określono atrybutu value przyjmowana jest kolejność oparta o pozycję węzła w dokumencie. Określenie numery za pomocą atrybutu value
jest niezbędne jeżeli zbiór węzłów jest sortowany lub przetwarzany w inny
zmieniający porządek węzłów sposób (por. punkt 3.10):
<xsl:template match=’katalog’>
<xsl:apply-templates select="czesc">
<xsl:sort select="nazwa"/>
</xsl:apply-templates>
</xsl:template>
<xsl:template match=’czesc’>
<xsl:number value="position()" format="1. " />
<xsl:value-of select="@typ"/>
<xsl:text>: </xsl:text>
<xsl:value-of select="nazwa"/>
</xsl:template>
W wyniku przetworzenia dokumentu zostanie wydrukowane ponumerowane zestawienie części posortowane w porządku alfabetycznym.
3.7 Zmienne
Za pomocą elementu <xsl:variable> możliwe jest zdefiniowanie zmiennej.
W przeciwieństwie do większości języków programowania wartość utworzonej w ten sposób zmiennej nie może być zmieniona. Nazwa zmiennej
3.8 Iteracje
17
jest określana jako wartość atrybutu name, wartość zaś albo jako zawartość
elementu, albo przez atrybut select, którego wartością jest wyrażenie.
Definicja <xsl:variable> może znajdować się na zewnątrz lub wewnątrz
szablonów. W pierwszym przypadku jest zmienną globalną w drugim jej
wartość jest określona wyłącznie dla węzłów potomnych szablonu.
Wartość zmiennej jest wstawiona za pomocą konstrukcji $nazwa-zmiennej.
3.8
Iteracje
Zawartością elementu <xsl:for-each> jest szablon wykonywany dla każdego węzła wybranego przez wyrażenie określone w atrybucie select tego elementu. Atrybut slect jest wymagany; wartość wyrażenia musi być
typu zbiór-węzłów. Dla każdego węzła ze zbioru-węzłów szablon jest wykonywany przy przyjęciu tego węzła za węzeł bieżący oraz przyjęciu zbioru
wszystkich wybranych węzłów jako bieżącej listy węzłów. Węzły są przetwarzane w porządku dokumentu lub w porządku określonym poleceniami
<xsl:sort> wstawionymi wewnątrz elementu <xsl:for> (por. 3.10). Przykładowo w wyniku przetworzenia poniższego szablonu zostanie wydrukowane zestawienie wszystkich elementów <title>, dzieci elementów <sect1>
i <sect2>, w porządku w jakim występują w dokumencie:
<xsl:template match="/">
<div class="toc">
<xsl:for-each select="//sect1|//sect2">
<p><xsl:value-of select="title"/></p>
</xsl:for-each>
</div>
</xsl:template>
3.9
Przetwarzanie warunkowe
Polecenia <xsl:if> oraz <xsl:choose> umożliwiają warunkowe przetwarzanie szablonów.
Wartością wymagalnego atrybutu test elementu <xsl:if> jest wyrażenie. Zawartością tego elementu jest szablon. Jeżeli logiczną wartością wyrażenia określonego w atrybucie test jest prawda, wykonywany jest szablon;
w przypadku przeciwnym nie jest wykonywane żadne działanie. Przykład:
<xsl:template match=’lista.nazw/nazwa’>
<xsl:apply-templates/>
<xsl:if test="not(position()=last())">, </xsl:if>
</xsl:template>
18
3 XSLT
Elementy <nazwa> wewnątrz elementu <lista.nazw> są oddzielone na wydruku przecinkiem, za wyjątkiem ostatniej nazwy na liście.
W kolejnym przykładzie co drugi wiersz tabeli jest drukowany na żółtym
tle:
<xsl:template match=’item’> <tr>
<xsl:if test="position() mod 2 = 0 ">
<xsl:attribute name="bgcolor">yellow</xsl:attribute>
</xsl:if>
<xsl:apply-templates/> </tr>
</xsl:template>
Polecenie <xsl:choose> pozwala na wybór z wielu możliwych wariantów. Zawartością <xsl:choose> jest ciąg elementów <xsl:when>, po których może wystąpić opcjonalny element <xsl:otherwise>. Każdy element
<xsl:when> posiada atrybut test zawierający wyrażenie. Zawartością elementów <xsl:when> oraz <xsl:otherwise> jest szablon. Przetworzenie elementu <xsl:choose> polega na obliczaniu logicznej wartości jego atrybutu test. Wykonywany jest szablon pierwszego i tylko tego elementu, dla
którego wartość jest równa prawda. Jeżeli żaden z warunków elementów
<xsl:when> nie ma wartości prawda, wykonywany jest szablon określony
przez zawartość elementu <xsl:otherwise>. Przykład:
<xsl:choose>
<xsl:when test="@team=’Telekom’">Team Deutsche Telekom</xsl:when>
<xsl:when test="@team=’Saeco’">Saeco-Cannondale</xsl:when>
<xsl:when test="@spec=’Once’">Once-Eroski</xsl:when>
<xsl:otherwise>inny</xsl:otherwise>
</xsl:choose>
3.10 Sortowanie
Sortowanie jest wykonywane po dodaniu elementu <xsl:sort> do zawartości elementów <xsl:apply-templates> lub <xsl:for-each>. Każdy element <xsl:sort> określa kolejny klucz sortowania.
Element <xsl:sort> ma atrybut select, którego wartością jest wyrażenie. Przy przyjęciu kolejno każdego przetwarzanego węzła jako węzła bieżącego oraz przyjęciu listy wszystkich przetwarzanych węzłów w porządku
dowolnym jako bieżącej listy węzłów obliczana jest wartość wyrażenia. Obliczona w ten sposób wartość jest konwertowana do napisu i stanowi klucz
sortowania. Domyślną wartością atrybutu select jest ., co oznacza, że domyślnym kluczem sortowania jest wartość węzła bieżącego po konwersji do
napisu.
Element <xsl:sort> może posiadać następujące atrybuty opcjonalne:
BIBLIOGRAFIA
19
order określenie porządku sortowania; dozwolone wartości to ascending
(porządek rosnący, przyjmowany domyślnie) oraz descending (porządek malejący).
lang określenie języka; zbiór wartości jest identyczny jak w przypadku
atrybutu xml:lang, np. lang="pl".
data-type określenie typu sortowanych obiektów oraz sposobu ich sortowania; dozwolone wartości, to:
text napisy sortowane w porządku alfabetycznym określonym ewentualnie za pomocą wartości atrybutu lang; number liczby sortowane numerycznie, atrybut lang jest w tym wypadku ignorowany;
qname symbole; sposób sortowania nie jest określony w specyfikacji XSLT;
case-order określenie czy duże litery (majuskuły) są sortowane przed ich
małymi odpowiednikami (minuskuły) czy też porządek powinien być
odwrotny. Atrybut ten ma znaczenie wyłącznie wtedy, gdy wartością
atrybutu data-type jest text. Wartość domyślna winna być zależna
od wybranego języka.
Poniższy szablon wydrukuje zestawienie części posortowane według ceny
od najdroższych do najtańszych z pliku katalog.xml:
<xsl:template match=’katalog’>
<xsl:apply-templates select="czesc">
<xsl:sort select="cena" data-type="number"/>
</xsl:apply-templates>
</xsl:template>
Aby zestawienie było posortowane oddzielnie dla każdego typu części, wystarczy zmodyfikować powyższy szablon dodając kolejny klucz sortowania:
<xsl:template match=’katalog’>
<xsl:apply-templates select="czesc">
<xsl:sort select="@typ"/>
<xsl:sort select="cena" data-type="number"/>
</xsl:apply-templates>
</xsl:template>
Bibliografia
[1] strona domowa Jamesa Clarka patrz http://www.jclark.com/.
20
BIBLIOGRAFIA
[2] Dokumentacja procesora FOP, patrz http://www.apache.org/fop.
[3] Michael Kay, XSLT Programmer’s Reference. Wrox Press Ltd., 2000.
[4] Pakiet do przetwarzania dokumentów SGML w języku Perl patrz
http://www.oasis-open.org/cover/publicSW.html#sgmlspm.
[5] World Wide Web Consortium, XSL Transformations (XSLT), patrz
http://www.w3.org/TR/xslt.html.
[6] World Wide Web Consortium, Extensible Stylesheet Language (XSL),
patrz http://www.w3.org/TR/xsl/.
[7] World Wide Web Consortium, XML Path Language (XPath), patrz
http://www.w3.org/TR/xpath.html.