From 1b54d9bfe2a6cb166bcadd159c54a179df151320 Mon Sep 17 00:00:00 2001 From: Isaac Riley Date: Tue, 14 Jan 2020 14:26:23 +0100 Subject: [PATCH] added toy example for output -> xml step --- csv2df.py | 3 +++ test_example.csv | 5 +++++ 2 files changed, 8 insertions(+) create mode 100644 csv2df.py create mode 100644 test_example.csv diff --git a/csv2df.py b/csv2df.py new file mode 100644 index 0000000..7f9ef52 --- /dev/null +++ b/csv2df.py @@ -0,0 +1,3 @@ +import pandas as pd +df = pd.read_csv("test_example.csv", header=None).rename( + columns={0:'chapter', 1:'sentence', 2:'text'}) diff --git a/test_example.csv b/test_example.csv new file mode 100644 index 0000000..30b27a9 --- /dev/null +++ b/test_example.csv @@ -0,0 +1,5 @@ +1,1,"Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo." +1,2,"Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt." +1,3,"Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam quaerat voluptatem." +2,1,"Ut enim ad minima veniam, quis nostrum exercitationem ullam corporis suscipit laboriosam, nisi ut aliquid ex ea commodi consequatur?" +2,2"Quis autem vel eum iure reprehenderit qui in ea voluptate velit esse quam nihil molestiae consequatur, vel illum qui dolorem eum fugiat quo voluptas nulla pariatur?" \ No newline at end of file