Bug 29252 - Snapshot Performance qcow2
Snapshot Performance qcow2
Status: CLOSED WORKSFORME
Product: UCS
Classification: Unclassified
Component: Virtualization - KVM
UCS 4.2
All Linux
: P5 normal (vote)
: ---
Assigned To: UCS maintainers
:
Depends on: 22231 23445
Blocks:
  Show dependency treegraph
 
Reported: 2012-11-16 08:49 CET by Philipp Hahn
Modified: 2023-06-28 10:46 CEST (History)
1 user (show)

See Also:
What kind of report is it?: Bug Report
What type of bug is this?: 2: Improvement: Would be a product improvement
Who will be affected by this bug?: 2: Will only affect a few installed domains
How will those affected feel about the bug?: 1: Nuisance – not a big deal but noticeable
User Pain: 0.023
Enterprise Customer affected?:
School Customer affected?:
ISV affected?:
Waiting Support:
Flags outvoted (downgraded) after PO Review:
Ticket number:
Bug group (optional): UCS Performance
Max CVSS v3 score:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Philipp Hahn univentionstaff 2012-11-16 08:49:09 CET
+++ This bug was initially created as a clone of Bug #22231 +++

Das Erstellen von Sicherungspunkten dauert mit qemu-1.1 immer noch sehr lange, selbst wenn cache=none gesetzt ist.
Hier soll nochmal recherchiert werden, warum das so ist und ob man QEMU so patchen kann, das beim Schreiben des VMSTATEs temporär sowas wie cache=unsafe benutzt wird.
Ein kurzer Test mit qemu-1.2 hat keine Besserung gezeigt, ich habe aber in Erinnerung, das entweder für 1.2 oder kurz danach dort was geändert wurde. Hier sollte noch mal die aktuelle git-Version ausprobiert werden.
Comment 1 Stefan Gohmann univentionstaff 2012-11-16 09:38:17 CET
Ich habe jetzt eine Vergleichsumgebung erstellt (3.0-2 + 3.1). Die Instanzen schreiben auf den gleichen NFS Server.

In beiden Systemen habe ich gleichzeitig eine 3.0 Installation gestartet (KVM) und sehr zeitnah in der Installation einen Snapshot erstellt. Beide Systeme haben ca. 5 Minuten benötigt und UMC hat einen Fehler angezeigt. Anschließend war die Instanz auf dem 3.1 System pausiert, auf dem 3.0 System wurde diese als laufend angezeigt, allerdings reagierte sie nicht mehr.
Comment 2 Stefan Gohmann univentionstaff 2012-11-16 09:51:24 CET
(In reply to comment #1)
> Ich habe jetzt eine Vergleichsumgebung erstellt (3.0-2 + 3.1). Die Instanzen
> schreiben auf den gleichen NFS Server.
> 
> In beiden Systemen habe ich gleichzeitig eine 3.0 Installation gestartet (KVM)
> und sehr zeitnah in der Installation einen Snapshot erstellt. Beide Systeme
> haben ca. 5 Minuten benötigt und UMC hat einen Fehler angezeigt. Anschließend
> war die Instanz auf dem 3.1 System pausiert, auf dem 3.0 System wurde diese als
> laufend angezeigt, allerdings reagierte sie nicht mehr.

Nach einiger Zeit lief die 3.1 Instanz dann weiter. Hier scheint also nur die Verbindung UVMM zu libvirt abgebrochen zu sein.
Comment 3 Stefan Gohmann univentionstaff 2012-11-16 10:52:01 CET
Schön ist, dass die Snapshots immer durch laufen. Beim direkten Vergleich zwischen Snapshots auf den lokalen Festplatten ist zu sehen, dass das qcow Image auf dem 3.0 System um mindestens Faktor 10 schneller wächst.

Neben der unterschiedlichen KVM / QCOW und Kernel Version, wird in 3.1 ext4 verwendet.
Comment 4 Stefan Gohmann univentionstaff 2012-11-16 11:19:25 CET
(In reply to comment #3)
> Schön ist, dass die Snapshots immer durch laufen. Beim direkten Vergleich
> zwischen Snapshots auf den lokalen Festplatten ist zu sehen, dass das qcow
> Image auf dem 3.0 System um mindestens Faktor 10 schneller wächst.
> 
> Neben der unterschiedlichen KVM / QCOW und Kernel Version, wird in 3.1 ext4
> verwendet.

ext3 ist auf dem 3.1 System genauso langsam.
Comment 5 Stefan Gohmann univentionstaff 2012-11-16 12:31:08 CET
Siehe auch https://bugs.launchpad.net/ubuntu/+source/qemu-kvm/+bug/741887/comments/4

Fazit, mit cache=unsafe ist es deutlich schneller. Da es das gewünschte Upstream Verhalten ist, belassen wir es zur 3.1 so. Besserung ist mit der nächsten QCOW-Version in Vorbereitung.
Comment 6 Philipp Hahn univentionstaff 2012-11-21 09:56:06 CET
Folgende Threads&Pacthes wären mal anzusehen:
<http://lists.nongnu.org/archive/html/qemu-devel/2012-11/msg01816.html>
<http://lists.nongnu.org/archive/html/qemu-devel/2012-11/msg02017.html>
Scheinbar ist das Rate-Limiting defekt, was selbst bei infinit die Schreibrate begrenzt. Da das SAVEVM diese Puffer-Implementierung nutzt, könnte das einen Teil der Probleme erklären.
Comment 7 Philipp Hahn univentionstaff 2012-12-17 11:54:32 CET
Von IBM gibt es ein gutes Dokument, was Performance-Tips für QEMU beschreibt:
<http://publib.boulder.ibm.com/infocenter/lnxinfo/v3r0m0/topic/liaat/liaatbestpractices_pdf.pdf>
Comment 8 Philipp Hahn univentionstaff 2017-04-21 16:36:50 CEST
UCS-4.2 uses Qemu-2.8, which has seen many improvements with Qcow2 performance.