-
Hier noch etwas vereinfacht:
Code:
With csv2rows as (Select Element as Satz from Table(SYSTOOLS.SPLIT(
GET_CLOB_FROM_FILE('/home/prouza/test.csv'), x'0D25')
)
),
rows2col as (select satz, regexp_substr(satz, '[^,]+') Spalte1,
regexp_substr(satz, '[^,]+', 1, 2) Spalte2,
regexp_substr(satz, '[^,]+', 1, 3) Spalte3,
regexp_substr(satz, '[^,]+', 1, 4) Spalte4,
regexp_substr(satz, '[^,]+', 1, 5) Spalte5,
regexp_substr(satz, '[^,]+', 1, 6) Spalte6
from csv2rows
)
select * from rows2col;
-
Der Lösungen gibt es viele!
Es geht auch ohne Regular Expressions (einfach nur Spalten, ohne Überschriften und ohne Anführungszeichen um die Alpha Felder):
Code:
With x as (Select * from Table(IFS_READ_UTF8('/home/Dir/Example.csv'))),
y as (Select x.*, Ordinal_Position ColKey,
Trim(B '"' from Element) as ColInfo
from x cross join Table(SysTools.Split(Line, ',')))
Select Line_Number,
Min(Case When ColKey = 1 Then ColInfo End) Col1,
Min(Case When ColKey = 2 Then ColInfo End) Col2,
Min(Case When ColKey = 3 Then ColInfo End) Col3,
Min(Case When ColKey = 4 Then ColInfo End) Col4,
Min(Case When ColKey = 5 Then ColInfo End) Col5,
Min(Case When ColKey = 6 Then ColInfo End) Col6,
Min(Case When ColKey = 7 Then ColInfo End) Col7
From y
Where Line_Number > 1
Group By Line_Number
Order By Line_Number
;
... mit GET_CLOB_FROM_FILE geht es auch, dann muss man allerdings 2 Splits machen.
Birgitta
Birgitta Hauser
Anwendungsmodernisierung, Beratung, Schulungen, Programmierung im Bereich RPG, SQL und Datenbank
IBM Champion 2021
Virtuelle SQL und RPG Schulungen
-
Wer die Aktuellen TRs eingespielt hat sollte auf jeden Fall auf die IFS_READ... Funktionen zurückgreifen, so wie von Birgitta vorgeschlagen.
Diese gehen um einiges schneller, als mit GET_CLOB_FROM_FILE und dann das Ergebnis mit Split aufzuteilen.
Für wem Performance eine Rolle spielt bietet, sollte auch noch zusätzlich wie im meinen Beispiel oben auf Regex zurückgreifen.
Bei größeren CSV Files ist diese Variante 6-7 mal schneller, da die SPLIT Funktion im Vergleich zu Regex viel langsamer ist.
lg Andreas
-
Wobei ich mich immer noch frage, warum man eine CSV selber auseinandernehmen muss.
Da gibt es soviele Varianten:
- Decimalcomma/-point
- Datumsformat
- Mit/Ohne Delimter (achtung, Delimiter sind innerhalb des Feldes verdoppelt)
- Trennzeichen: , ; Tab
- Mit/Ohne Null
Bisher hat mich der CPYxxxIMPF da immer comfortabel und vor allem auch schnell weitergebracht.
-
Wobei ich mich immer noch frage, warum man eine CSV selber auseinandernehmen muss.
Weil man sie vielleicht direkt verarbeiten und nicht erst lange herumkopieren möchte?
Birgitta Hauser
Anwendungsmodernisierung, Beratung, Schulungen, Programmierung im Bereich RPG, SQL und Datenbank
IBM Champion 2021
Virtuelle SQL und RPG Schulungen
-
 Zitat von Andreas_Prouza
Wer die Aktuellen TRs eingespielt hat sollte auf jeden Fall auf die IFS_READ... Funktionen zurückgreifen, so wie von Birgitta vorgeschlagen.
Diese gehen um einiges schneller, als mit GET_CLOB_FROM_FILE und dann das Ergebnis mit Split aufzuteilen.
Die SPLIT-Funktion kann man im übrigen beträchtlich beschleunigen, in dem man sich basierend auf dem Quellcode der SPLIT-Funktion (bekommt man durch Reverse Engineering) eine neue Funktion generiert, die anstatt mit den großen LOBs zu arbeiten, VarChar Datentypen verwendet.
... im übrigen wird das (so oder so ähnlich) sogar in der Dokumentation vorgeschlagen.
Deshalb kommt man ja auch an den SourceCode (der normalerweise verschlüsselt ist) dran.
Mit einer solchen Funktion löst man eine IFS-Datei um ein x-faches schneller auf.
Birgitta
Birgitta Hauser
Anwendungsmodernisierung, Beratung, Schulungen, Programmierung im Bereich RPG, SQL und Datenbank
IBM Champion 2021
Virtuelle SQL und RPG Schulungen
-
Nun, da solche Importe ja keine Einmalaktionen sind, ist eine komfortable Bearbeitung direkt mit SQL nach dem CPYxxx erheblich einfacher. Zumal die Datei zu Dokumentationszweicek auch meist noch aufgehoben werden muss. Ich muss mich auch nicht selber um die Typanapssung in Zahlen/Datum kümmern.
Ich liebe halt den einfachen statt des komplizerten Weges;-).
Aber es kann ja jeder machen was er will, auch Übungsaufgaben.
-
DANKE an alle, mit euren Infos konnte ich das Problem lösen.
-
Das Problem des Splits ist ja, dass es beim Vorkommen des Trennzeichens innerhalb eines Spaltenwertes zu Verschiebungen der Inhalte kommt:
123.45,"Müller, Johannes",03.07.1963
Der CPY-Import regelt sowas halt;-).
Ähnliche Themen
-
Von KingofKning im Forum NEWSboard Programmierung
Antworten: 8
Letzter Beitrag: 04-11-19, 08:59
-
Von programmer400 im Forum NEWSboard Drucker
Antworten: 7
Letzter Beitrag: 26-07-17, 11:58
-
Von _MG_ im Forum NEWSboard Programmierung
Antworten: 10
Letzter Beitrag: 14-12-16, 16:45
-
Von dibe im Forum NEWSboard Programmierung
Antworten: 20
Letzter Beitrag: 25-02-16, 16:33
-
Von gerhardsw im Forum NEWSboard Programmierung
Antworten: 3
Letzter Beitrag: 20-12-13, 10:27
Berechtigungen
- Neue Themen erstellen: Nein
- Themen beantworten: Nein
- Anhänge hochladen: Nein
- Beiträge bearbeiten: Nein
-
Foren-Regeln
|
Erweiterte Foren Suche
Google Foren Suche
Forum & Artikel Update eMail
AS/400 / IBM i
Server Expert Gruppen
Unternehmens IT
|
Kategorien online Artikel
- Big Data, Analytics, BI, MIS
- Cloud, Social Media, Devices
- DMS, Archivierung, Druck
- ERP + Add-ons, Business Software
- Hochverfügbarkeit
- Human Resources, Personal
- IBM Announcements
- IT-Karikaturen
- Leitartikel
- Load`n`go
- Messen, Veranstaltungen
- NEWSolutions Dossiers
- Programmierung
- Security
- Software Development + Change Mgmt.
- Solutions & Provider
- Speicher – Storage
- Strategische Berichte
- Systemmanagement
- Tools, Hot-Tips
Auf dem Laufenden bleiben
|
Lesezeichen