Bug 16323 - NetworkManager Problem: kein DHCP für eth0 beim Boot
NetworkManager Problem: kein DHCP für eth0 beim Boot
Status: CLOSED FIXED
Product: UCS
Classification: Unclassified
Component: Network
UCS 2.3
Other Linux
: P5 normal (vote)
: UCS 2.3
Assigned To: Arvid Requate
Tim Petersen
:
Depends on: 16318
Blocks: 8994
  Show dependency treegraph
 
Reported: 2009-11-11 12:28 CET by Arvid Requate
Modified: 2009-12-21 08:47 CET (History)
1 user (show)

See Also:
What kind of report is it?: ---
What type of bug is this?: ---
Who will be affected by this bug?: ---
How will those affected feel about the bug?: ---
User Pain:
Enterprise Customer affected?:
School Customer affected?:
ISV affected?:
Waiting Support:
Flags outvoted (downgraded) after PO Review:
Ticket number:
Bug group (optional):
Max CVSS v3 score:


Attachments
Syslog (611.20 KB, application/octet-stream)
2009-11-27 10:14 CET, Arvid Requate
Details
syslogauszug auf mobile client (4.43 KB, text/plain)
2009-12-01 10:04 CET, Tim Petersen
Details

Note You need to log in before you can comment on or make changes to this bug.
Description Arvid Requate univentionstaff 2009-11-11 12:28:33 CET
Auf einem Master mit DHCP Option für eth0 startet der NetworkManager kein dhclient, anscheinend wegen einem dbus-Kommunikationsproblem zwischen nm-system-settings und org.freedesktop.hal. Dadurch wird dann auch das fallback Script nicht gestartet und man hat die Situation, die an Bug 8994 Kommentar #22 beschrieben ist.

Folgendes steht im daemin.log:

Nov 11 11:36:51 beta3 NetworkManager: nm_dbus_manager_has_owner(): NameHasOwner request failed: Did not receive a reply. Possible causes include: the remote application did not send a reply, the message bus security policy blocked the reply, the reply timeout expired, or the network connection was broken.
Nov 11 11:36:51 beta3 NetworkManager: <info> Waiting for HAL to start...
Nov 11 11:36:58 beta3 NetworkManager: <info> Trying to start the supplicant...

Die Meldung ist ein bisschen bizarr. Wenn man in das network-manager init script vor dem Start von nm-system-settings die MACs aller devices mit folgendem Kommando abfragt, bekommt man sie genannt:

        for id in $(dbus-send --system --print-reply \
         --dest=org.freedesktop.Hal \
         /org/freedesktop/Hal/Manager \
        org.freedesktop.Hal.Manager.FindDeviceByCapability string:net | sed -n 's/^ *string "\(.*\)"$/\1/p'); do
        dbus-send --system --print-reply \
         --dest=org.freedesktop.Hal \
         $id \
         org.freedesktop.Hal.Device.GetProperty string:net.address
        done > /tmp/mac
Comment 1 Arvid Requate univentionstaff 2009-11-11 16:04:03 CET
Der Fehler scheint durch einen früheren Startzeitpunkt für das init Script
vermeidbar zu sein. (Bug #16318)
Comment 2 Stefan Gohmann univentionstaff 2009-11-12 10:02:37 CET
Bitte diverse Installationen mit und ohne DHCP testen.
Comment 3 Felix Botner univentionstaff 2009-11-20 14:19:56 CET
Master und Backup (i386 amd64) mit DHCP ohne DHCP - OK (falls dhcp verwendet wird, nimmt er die Fallback Adresse wenn dhcp nichts findet).

Auf mobile/managed clients gibt es einen solchen Fallback nicht.
Comment 4 Arvid Requate univentionstaff 2009-11-27 10:14:00 CET
Created attachment 2068 [details]
Syslog

Das Problem ist auf einem Mobile Client wieder aufgetreten.
In dem angehängten Syslog sieht man, dass nach dem letzten Boot der NetworkManager 10 sec lang hängt, bis nm-system-settings Probleme bei der Kommunikation mit HAL meldet. NetworkManager startet daher dann nicht dhclient und das System bleibt ohne IP-Adresse. Wie im Syslog sichtbar, hat der NetworkManager vor dem reboot (VM war gekillt worden) keine derartigen Probleme gehabt und alles funktionierte normal.

Hier die Haupt-Meldung aus dem Syslog, damit man das per Bugzilla-Suche wiederfindet:
----------------------------------------------------------------------
Nov 27 10:45:40 qa23mobi NetworkManager: <info>  starting...
Nov 27 10:45:42 qa23mobi univention-directory-listener: start_tls: Can't contact
 LDAP server
Nov 27 10:45:42 qa23mobi anacron[4306]: Anacron 2.3 started on 2009-11-27
Nov 27 10:45:42 qa23mobi anacron[4306]: Will run job `cron.daily' in 5 min.
Nov 27 10:45:42 qa23mobi anacron[4306]: Jobs will be executed sequentially
Nov 27 10:45:43 qa23mobi /usr/sbin/cron[4331]: (CRON) INFO (pidfile fd = 3)
Nov 27 10:45:43 qa23mobi /usr/sbin/cron[4335]: (CRON) STARTUP (fork ok)
Nov 27 10:45:43 qa23mobi /usr/sbin/cron[4335]: (CRON) INFO (Running @reboot jobs
)
Nov 27 10:45:43 qa23mobi /USR/SBIN/CRON[4370]: (root) CMD (/usr/share/univention
-mobile-client/check_connection)
Nov 27 10:45:46 qa23mobi acpid: client connected from 4442[0:0]
Nov 27 10:45:46 qa23mobi acpid: 1 client rule loaded
Nov 27 10:45:47 qa23mobi kernel: [   93.423168] mtrr: your processor doesn't sup
port write-combining
Nov 27 10:45:50 qa23mobi nm-system-settings: Error getting hardware address for
/org/freedesktop/Hal/devices/net_00_0c_29_e6_88_e9: (4) Did not receive a reply.
 Possible causes include: the remote application did not send a reply, the messa
ge bus security policy blocked the reply, the reply timeout expired, or the netw
ork connection was broken.
----------------------------------------------------------------------

Note: Init Reihenfolge war S26network-manager, vermutlich hat das aber Nichts damit zu tun.
Comment 5 Arvid Requate univentionstaff 2009-11-30 10:28:01 CET
Das ist im Kommentar an Bug 16318#c20 weiter verfolgt und sollte mit dem Workaround (Bug 16318#c23) gefixed sein.
Comment 6 Tim Petersen univentionstaff 2009-12-01 10:04:06 CET
Created attachment 2076 [details]
syslogauszug auf mobile client

Mit aktueller 2.3 DVD und MobileClient Neuinstallation getestet.
Automatischer Join im Zuge der Installation war erfolgreich - eth0 bekommt auch anschließend bei jedem Boot eine IP zugewisen, bzw. dhclient wird erfolgreich gestartet - syslog Verlauf in Bezug auf den networkManager hängt an.
Comment 7 Tim Petersen univentionstaff 2009-12-01 10:04:28 CET
verified
Comment 8 Stefan Gohmann univentionstaff 2009-12-21 08:47:14 CET
UCS 2.3 wurde veröffentlicht. Sollte der hier beschriebene Bug mit einer neueren Version von UCS erneut auftreten, so sollte der Bug dupliziert werden: "Clone This Bug".