OPNsense Forum

International Forums => German - Deutsch => Topic started by: nullinger on October 17, 2017, 12:36:31 pm

Title: Wie am besten potentiellen Bug finden ?
Post by: nullinger on October 17, 2017, 12:36:31 pm
Hallo,

seit etwas längerer Zeit habe ich mit einer meiner OPNSenses kleine Meinungsverschiedenheiten, die sich bislang nicht lösen ließen und ziemlich schwer aufzuspüren sind. Ich vermute entweder einen Bug direkt in OPNSense oder einen Bug in Kombination mit der verwendeten Hardware. Da inzwischen ein von Monaten bestelltes LTE-Modem eingetroffen ist, wollte ich erneut die Inbetriebnahme von Failover-Multiwan ausprobieren, und prompt meldete sich der Bug wieder zur Stelle. Leider sind die Logs erstaunlich unaussagekräftig, deswegen wollte ich fragen ob es bessere Möglichkeiten zum Debuggen gibt, das ich verwertbare Protokolle für einen anständigen Bugreport habe.

Konkret geht es um folgendes Setup und Problem:

SuperMicro A1SRM-2558F, Intel Atom C2558
2x 4GB ECC RAM
2x Samsung 850 Evo SSD
4x Intel GbE LAN onBoard
aktuellste OPNSense-Version

Die Interfaces sind wie folgt angelegt:

igb0:  pppoe0 über Draytek Vigor 130 (VDSL2+)
         opt1 (10.0.200.10) für Zugriff auf DSL Modem
igb1:  igb1,lan (10.0.0.1/22) an 1. Mikrotik CRS125G-24-RM
igb2:  igb2,unkonfiguriert an 3. Mikrotik CRS125G-24-RM
         opt2, vlan20 (10.0.24.1/21)
         opt3, vlan40 (10.0.40.1/24)
         opt6, vlan10 (10.0.10.1/24)
         opt7, vlan30 (10.0.36.1/23)
igb3:  unkonfiguriert

Bis an diesen Punkt funktioniert alles einwandfrei. Nun möchte ich seit Juni das Setup um ein Multiwan-Failover über LTE ergänzen, und an diesem Punkt geht dann alles schief. Die erste Variante war per ppp oder ncm/qpi per USB-LTE-Modem. Hier trat damals der Bug auf, deswegen verwarf ich das ganze und versuchte es mit einem TP-Link LTE Router an igb3. Ebenfalls selber Bug. Daraufhin bestellte ich das bis dato nicht lieferbaren Mikrotik WAP LTE Kit (https://mikrotik.com/product/wap_lte_kit), um eine etwas handfestere nicht fricklige Lösung zu haben. Das LTE Kit kam jetzt am Montag, deswegen wurde es gleich ausprobiert, und zonk: Bug!

Das Problem habe ich bisher noch nicht beschrieben, es äußert sich wie folgt:

Irgendwo zwischen Anlegen des Interfaces und dem Konfigurieren von MultiWAN wird die Weboberfläche unresponsiv, das System beginnt zu hängen und letztendlich kracht das Netzwerk zusammen: WAN geht offline, die VLANs funktionieren nur noch teilweise und verlieren teilweise ihre Konfiguration (werden beim SSH Login entweder ohne IP oder gar nicht mehr angezeigt), Internetzugang funktioniert nur noch teilweise. Externe Erreichbarkeit (SSH, HTTPS, IPSEC) ist nicht mehr gegeben. Dies lässt sich auch durch einen Neustart der OPNSense nicht beheben, nur noch durch eine Wiederherstellung der alten Konfiguration über die lokale Konsole. In den Logs konnte ich bisher nicht verwertbares finden. Beim Hochfahren bleibt die OPNSense ca. 1-2 Minuten bei "configuring wan interfaces..." hängen und kann die VLANs offensichtlich nicht ordentlich konfigurieren. Das Problem ist immer reproduzierbar, auch bei einer komplett frisch installierten OPNSense. Ich habe alles probiert, auch bei kompletter Konfiguration ohne Webinterface an der lokalen Konsole tritt das Problem auf. Erstaunlicherweise kommt es ab und zu nach einer langen Zeitspanne wieder zu einem "normalen" Betriebszustand, das System ging gestern aufgrund des Bugs gegen 23.30 Uhr offline und war gegen 09.30 Uhr heute morgen ohne Eingriff wieder online.

Ich vermute entweder einen Bug in OPNSense, configd, oder im Zusammenspiel zwischen FreeBSD und der Hardware (Intel i354 quad-GbE).

Ich möchte einen neuen Versuch mit einer Neuinstallation von OPNSense 17.7 starten, aber gleichzeitig auch verwertbare Daten sammeln für einen Bugreport - wie stelle ich das am besten an ?
Title: Re: Wie am besten potentiellen Bug finden ?
Post by: franco on October 18, 2017, 09:26:07 am
Hi nullinger,

Wir brauchen hier Logs der Verbindungsabbrüche. Debuggen kann man am besten durch erweitern der Log-Einträge, sodass sich bestimmen lässt wo genau es hängt... im Idealfall zwischen jede Funktion in den Skripten.

Allerdings... erstmal müsste eingegrenzt werden wo das Problem auftritt, daher die vorher angemerkte Logdurchsicht.


Grüsse
Franco
Title: Re: Wie am besten potentiellen Bug finden ?
Post by: NilsS on October 18, 2017, 09:52:41 am
Hast du eine feste DNS Konfiguration? oder übernimmst du die DNS Einstellungen vom WAN?
So wie du es beschreibst, scheint der LTE Zugang ja auch die IP über DHCP zu bekommen. Ich meine irgendwo hier im Forum war doch auch ein Problem mit mehreren über DHCP bezogenen WANs beschrieben.