next up previous contents
Nächste Seite: Repräsentation durch Fourier-Deskriptoren Aufwärts: Einleitung Vorherige Seite: CSS-Repräsentation zur Beschreibung von   Inhalt

Angular-Radial-Transformation (ART)

Abbildung: Darstellung der ersten 36 Basisfunktionen der ART-Repräsentation [51].
\includegraphics[width=100mm]{Bilder/art_basis.eps}
Die ART-Repräsentation ist eine regionbasierte Formrepräsentation und bildet mit der konturorientierten CSS-Repräsentationstechnik die beiden Formbeschreibungstechniken des MPEG-7 Standards [6]. Die ART-Repräsentation beschreibt die Form eines Objektes kompakt und effizient. Außerdem ist sie invariant gegenüber Rotation und Verzerrung der Objektform.
Die ART-Repräsentation eines Objektes besteht aus Koeffizienten $ F_{nm}$, die sich gemäß Gleichung 5.15 berechnen lassen. Diese Koeffizienten entsprechen den in Abschnitt 5.4.2 beschriebenen Zernike-Momenten. Der Unterschied zwischen Zernike-Momenten und der ART-Repräsentation ist die Wahl der Basisfunktionen, die zur Berechnung eingesetzt werden.
Analog zu den Zernike-Momenten bezeichnen $ V_{nm}(\rho ,\Theta)$ die Basisfunktionen der ART-Repräsentation. Sie besitzen die Ordnung $ n$ und $ m$ und lassen sich, wie in Gleichung 5.16 zu sehen ist, in einen radialen und einen winkelabhängigen Teil separieren. Die Variable $ f(\rho ,\Theta)$ ist ein binäres Bild in Polarkoordinaten, welches das zu untersuchende Objekt (oder auch mehrere) enthält. Die ART-Repräsentation lässt sich in abgewandelter Form auch auf Graustufen und Farbbilder anwenden [18][51].

$\displaystyle F_{nm}$ $\displaystyle =$ $\displaystyle \langle V_{nm}(\rho ,\Theta),f(\rho ,\Theta)\rangle\notag$ (5.15)
  $\displaystyle =$ $\displaystyle \int\limits_{0}^{2\pi}\int\limits_{0}^{1}V_{nm}^*(\rho ,\Theta)
f(\rho ,\Theta)\rho \, d\rho \, d\Theta$ (5.16)


$\displaystyle V_{nm}(\rho ,\Theta)=\frac{1}{2\pi}e^{im\Theta}R_n(\rho )$     (5.17)
$\displaystyle R_n(\rho )=\begin{cases}1,\quad n=0\\ 2\cos(\pi n\rho ),\quad n\neq0
\end{cases}$     (5.18)

Im MPEG-7 Standard wird empfohlen, die Magnitude der ersten 35 Koeffizienten zur Beschreibung der Objektform heranzuziehen, wobei der erste Koeffizient nicht berücksichtigt werden soll, da dieser zum Normalisieren der restlichen Koeffizienten eingesetzt wird. Es werden drei radiale und zwölf winkelabhängige Funktionen eingesetzt ($ n\leq
3$ und $ m\leq 12$), um die Koeffizienten zu bestimmen. Abbildung 5.10 zeigt diese Funktionen.
next up previous contents
Nächste Seite: Repräsentation durch Fourier-Deskriptoren Aufwärts: Einleitung Vorherige Seite: CSS-Repräsentation zur Beschreibung von   Inhalt
Stefan Stiene 2006-04-03