Datenstrukturen: Unterschied zwischen den Versionen

Aus Das Sopra Wiki
Zur Navigation springen Zur Suche springen
Zeile 250: Zeile 250:
Alle Eigenschaften und Bemerkungen aus der vorherigen Sektion gelten auch hier.  
Alle Eigenschaften und Bemerkungen aus der vorherigen Sektion gelten auch hier.  


Der Quellcode des für die Tests verwendeten Miniprogramms kann [[DatenstrukturenSpeedTest|hier]] eingesehen werden.
Der Quellcode des für die Tests verwendeten Miniprogramms kann [[DatenstrukturenSpeedTest|hier]] eingesehen werden, das ursprüngliche Logfile [[File:datastructure_speed_log.txt|hier]].
 
Die Tests wurden mit folgenden Parametern durchgeführt:
* Alle Messungen wurden mit <tt>System.Diagnostics.Stopwatch</tt> durchgeführt.
* Es wurden 100.000 zufällige und disjunkte Int32 Werte erzeugt (zwischen 0 und Int32.Max) und in einem Array gespeichert.
* Diese Werte wurden für die Tests Add (mit [[foreach]]), Remove (mit [[for]]), ElementAt (mit [[for]]) und Contains (mit [[for]]) aus diesem Array extrahiert.  


=== ein-elementige Datenstrukturen  ===
=== ein-elementige Datenstrukturen  ===

Version vom 19. April 2009, 19:27 Uhr



Hinweise

  • Falls nicht anders angegeben sind Laufzeiten immer Average Case.
  • Alle Links zu den Datenstrukturen zeigen auf die englische Version der MSDN. Diese ist typischerweise vollständiger und genauer als ihre deutsche Übersetzung.
  • Die meisten der hier vorgestellten Datenstrukturen (alle außer Hashtable) sind Generics. Ihre Verwendung wird im Generic-Artikel erklärt.
  • n entspricht immer dem Count der Datenstruktur, d.h. der Anzahl an Elementen in der Struktur.
  • Mit Element-Typ wird hier der Wert bezeichnet, den der Enumerator bei einer Foreach-Anweisung zurückgibt.
  • ElementAt ist eine spezielle Extension Method. Bei Strukturen die das Interface IList<T> implementieren gibt sie das Element an der angegebenen Position an, ansonsten iteriert sie so oft wie angegeben und gibt das Element an dieser Stelle zurück. [1]
  • Datenstrukturen die auf Arrays basieren besitzen intern eine Capacity. Diese gibt die aktuelle Größe des internen Arrays an. Capacity ist immer größer bzw. gleich Count. Sollte beim Hinzufügen eines Elements die Capacity der Struktur überschritten werden, muss diese wachsen. Dazu erzeugt sie intern einen neuen, größeren Array und kopiert alle bis dahin vorhandenen Einträge in diesen neuen Array. Typischerweise ist die neue Größe des Arrays die erste Primzahl, die größer als das Doppelte der alten Capacity ist.

Laufzeiten und Eigenschaften (nach MSDN)

ein-elementige Datenstrukturen


Laufzeiten

Add Remove ElementAt Contains Clear Count Element-Typ Thread-safe Bemerkungen
HashSet<T> O(1)
O(n) wenn Count + 1 > Capacity
O(1) O(n) O(1) O(n) O(1) T Nein keine Duplikate
LinkedList<T> O(1) O(1) O(n) O(n) O(n) O(1) T Nein
List<T> O(1)
O(n) wenn Count + 1 > Capacity
O(n) O(1) O(n) O(n) O(1) T Nein
Queue<T> O(1)
O(n) wenn Count + 1 > Capacity
O(1)
O(n)
O(n)
O(n)
O(1)
T
Nein

Remove und Add sind Deqeue und Enqueue


Stack<T> O(1)
O(n) wenn Count + 1 > Capacity
O(1)
O(n)
O(n)
O(n)
O(1)
T
Nein
Remove und Add sind Pop und Push
SynchronizedCollection<T> O(1)
O(n) wenn Count + 1 > Capacity
O(n)
O(1)
O(n)
O(n)
O(1)
T
Ja

benutzt intern List<T>, hat aber zusätzliche Mechanismen
um Thread-safety zu garantieren


zwei-elementige Datenstrukturen

Alle Datenstrukturen in dieser Liste haben folgendes gemeinsam:

  • Keys müssen eindeutig sein.
  • Keys dürfen nicht von "außen" verändert werden (immutable).
  • Die Add-Methode wirft eine Exception wenn der Key bereits vorhanden ist.
  • Die Values können über die Item-Property der Datenstruktur angesprochen werden:
    myDataStructure[key] = expression;
    
    Dabei wird ein Wert
    • wenn der Key bereits vorhanden ist überschrieben
    • wenn der Key noch nicht vorhanden ist neu angelegt.
  • Sie implementieren das IDictionary-Interface.
  • Die Laufzeit für ElementAt ist für alle außer Hashtable O(n). Hashtable unterstützt diese Methode nicht.

Außerdem sortieren sowohl SortedDictionary<TKey,TValue> als auch SortedList<TKey,TValue> ihren Inhalt beim einfügen, d.h. wenn man mit einer foreach-Anweisung (o.ä.) über sie iteriert, erhält man die Elemente geordnet zurück. Dabei wird die Ordnung durch den beim Erzeugen angegebenen Comparer bestimmt. Wird kein spezieller Comparer angegeben, verwenden sie einen Standard-Comparer für TKey, der das Interface IComparer<T> erfüllt.


Laufzeiten
Add Remove ContainsKey Clear Count Element-Typ Thread-safe Bemerkungen
Dictionary<TKey, TValue> O(1)
O(n) wenn Count + 1 > Capacity
O(1) O(1) O(n) O(1) KeyValuePair<TKey,TValue> Nein Verfügt über TryGetValue-Methode
SortedDictionary<TKey, TValue> O(log n) O(log n) O(log n) O(n) O(1) KeyValuePair<TKey,TValue> Nein Verfügt über TryGetValue-Methode
schneller als SortedList bei unsortierten Daten
Hashtable O(1)
O(n) wenn Count + 1 > Capacity
O(1) O(1) O(n) O(1) KeyValuePair<object,object>
oder
DictionaryEntry
Read-Only mit einem schreibenden Thread Die initiale Capacity der Hashtable kann im Konstruktor angegeben werden: Hashtable(Int32)
SortedList<TKey, TValue> O(n) O(n) O(log n) O(n) O(1) KeyValuePair<TKey,TValue> Nein Verfügt über TryGetValue-Methode
schneller als SortedDictionary bei vorsortierten Daten

Laufzeiten nach eigenen Tests in ms

Alle Eigenschaften und Bemerkungen aus der vorherigen Sektion gelten auch hier.

Der Quellcode des für die Tests verwendeten Miniprogramms kann hier eingesehen werden, das ursprüngliche Logfile Datei:Datastructure speed log.txt.

Die Tests wurden mit folgenden Parametern durchgeführt:

  • Alle Messungen wurden mit System.Diagnostics.Stopwatch durchgeführt.
  • Es wurden 100.000 zufällige und disjunkte Int32 Werte erzeugt (zwischen 0 und Int32.Max) und in einem Array gespeichert.
  • Diese Werte wurden für die Tests Add (mit foreach), Remove (mit for), ElementAt (mit for) und Contains (mit for) aus diesem Array extrahiert.

ein-elementige Datenstrukturen


Laufzeiten

Add Remove ElementAt Contains Clear Count
HashSet<T> O(1)
O(n) wenn Count + 1 > Capacity
O(1) O(n) O(1) O(n) O(1)
LinkedList<T> O(1) O(1) O(n) O(n) O(n) O(1)
List<T> O(1)
O(n) wenn Count + 1 > Capacity
O(n) O(1) O(n) O(n) O(1)
Queue<T> O(1)
O(n) wenn Count + 1 > Capacity
O(1)
O(n)
O(n)
O(n)
O(1)
Stack<T> O(1)
O(n) wenn Count + 1 > Capacity
O(1)
O(n)
O(n)
O(n)
O(1)
SynchronizedCollection<T> O(1)
O(n) wenn Count + 1 > Capacity
O(n)
O(1)
O(n)
O(n)
O(1)

zwei-elementige Datenstrukturen

Laufzeiten
Add Remove ContainsKey Clear Count
Dictionary<TKey, TValue> O(1)
O(n) wenn Count + 1 > Capacity
O(1) O(1) O(n) O(1)
SortedDictionary<TKey, TValue> O(log n) O(log n) O(log n) O(n) O(1)
Hashtable O(1)
O(n) wenn Count + 1 > Capacity
O(1) O(1) O(n) O(1)
SortedList<TKey, TValue> O(n) O(n) O(log n) O(n) O(1)

Referenzen