To get started: consult start

Export to Excel¶

In a notebook, you can perform searches and view them in a tabular display and zoom in on items with pretty displays.

But there are times that you want to take your results outside Text-Fabric, outside a notebook, outside Python, and just work with them in other programs, such as Excel.

You want to do that not only with query results, but with all kinds of lists of tuples of nodes.

There is a function for that, A.export(), and here we show what it can do.

In [1]:

%load_ext autoreload
%autoreload 2

In [2]:

import os
from tf.app import use

In [3]:

A = use("Nino-cunei/oldassyrian", hoist=globals())

TF-app: ~/text-fabric-data/Nino-cunei/oldassyrian/app

data: ~/text-fabric-data/Nino-cunei/oldassyrian/tf/0.1

This is Text-Fabric 9.2.2
Api reference : https://annotation.github.io/text-fabric/tf/cheatsheet.html

67 features found and 0 ignored

Text-Fabric: Text-Fabric API 9.2.2, Nino-cunei/oldassyrian/app v3, Search Reference
Data: OLDASSYRIAN, Character table, Feature docs
Features:

Old Assyrian Documents 2000-1600: Cuneiform tablets

ARK

str

persistent identifier of type ARK from metadata field "UCLA Library ARK"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:37Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

after

str

what comes after a sign or word (- or space)

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:37Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

afterr

str

what comes after a sign or word (- or space); between adjacent signs a ␣ is inserted

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:38Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

afteru

str

what comes after a sign when represented as unicode (space)

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:39Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

atf

str

full atf of a sign (without cluster chars) or word (including cluster chars)

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:40Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

atfpost

str

atf of cluster closings at sign

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

atfpre

str

atf of cluster openings at sign

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

author

str

author from metadata field "Author(s)"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

col

int

ATF column number

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

collection

str

collection of a document

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

comment

str

$ comment to line or inline comment to slot ($ and $)

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

damage

int

whether a sign is damaged

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

det

int

whether a sign is a determinative gloss - between braces { }

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

docnote

str

additional remarks in the document identification

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

docnumber

str

number of a document within a collection-volume

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

excavation

str

excavation number from metadata field "Excavation no."

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

excised

int

whether a sign is excised - between double angle brackets << >>

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

face

str

full name of a face including the enclosing object

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

flags

str

sequence of flags after a sign

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

fraction

str

fraction of a numeral

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

genre

str

genre from metadata field "Genre"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

grapheme

str

grapheme of a sign

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

graphemer

str

grapheme of a sign using non-ascii characters

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

graphemeu

str

grapheme of a sign using cuneiform unicode characters

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

lang

str

language of a document

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

langalt

int

1 if a sign is in the alternate language (i.e. Sumerian) - between underscores _ _

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

ln

int

ATF line number of a numbered line, without prime

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

lnc

str

ATF line identification of a comment line ($)

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

lnno

str

ATF line number, may be $ or #, with prime; column number prepended

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:41Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

material

str

material indication from metadata field "Material"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

missing

int

whether a sign is missing - between square brackets [ ]

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

museumcode

str

museum code from metadata field "Museum no."

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

museumname

str

museum name from metadata field "Collection"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

object

str

name of an object of a document

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

operator

str

the ! or x in a !() or x() construction

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

operatorr

str

the ! or x in a !() or x() construction, represented as =, ␣

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

operatoru

str

the ! or x in a !() or x() construction, represented as =, ␣

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

otype

str

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

period

str

period indication from metadata field "Period"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

pnumber

str

P number of a document

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

primecol

int

whether a prime is present on a column number

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

primeln

int

whether a prime is present on a line number

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

pubdate

str

publication date from metadata field "Publication date"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

question

int

whether a sign has the question flag (?)

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

reading

str

reading of a sign

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:42Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

readingr

str

reading of a sign using non-ascii characters

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:43Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

readingu

str

reading of a sign using cuneiform unicode characters

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:44Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

remarkable

int

whether a sign is remarkable (!)

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:44Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

remarks

str

# comment to line

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:44Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

repeat

int

repeat of a numeral; the value n (unknown) is represented as -1

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:44Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

srcLn

str

full line in source file

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:45Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

srcLnNum

int

line number in source file

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:45Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

srcfile

str

source file name of a document

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:45Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

subgenre

str

genre from metadata field "Sub-genre"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:45Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

supplied

int

whether a sign is supplied - between angle brackets < >

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:45Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

sym

str

essential part of a sign or of a word

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:45Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

symr

str

essential part of a sign or of a word using non-ascii characters

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:46Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

symu

str

essential part of a sign or of a word using cuneiform unicode characters

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:48Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

trans

int

whether a line has a translation

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:49Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

transcriber

str

person who did the encoding into ATF from metadata field "ATF source"

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:49Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

translation@ll

str

translation of line in language en = English

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:49Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

type

str

name of a type of cluster or kind of sign

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:49Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

uncertain

int

whether a sign is uncertain - between brackets ( )

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:50Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

version

str

version from meta data line

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:50Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

volume

int

volume of a document within a collection

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:50Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

oslots

none

converters:

Alba de Ridder, Martijn Kokken, Cale Johnson, Dirk Roorda

dateWritten:

2020-06-26T08:32:50Z

editor:

various

institute:

CDL

name:

Old Assyrian Documents

writtenBy:

Text-Fabric

Text-Fabric API: names N F E L T S C TF directly usable

Inspect the contents of a file¶

We write a function that can peek into file on your system, and show the first few lines. We'll use it to inspect the exported files that we are going to produce.

In [4]:

EXPORT_FILE = os.path.expanduser("~/Downloads/results.tsv")
UPTO = 10


def checkout():
    with open(EXPORT_FILE, encoding="utf_16") as fh:
        for (i, line) in enumerate(fh):
            if i >= UPTO:
                break
            print(line.rstrip("\n"))

Encoding¶

Our exported .tsv files open in Excel without hassle, even if they contain non-latin characters. That is because TF writes such files in an encoding that works well with Excel: utf_16_le. You can just open them in Excel, there is no need for conversion before or after opening these files.

Should you want to process these files by means of a (Python) program, take care to read them with encoding utf_16.

Example query¶

We first run a query in order to export the results.

In [5]:

query = """
line ln<4
  =: sign reading=um
  <: sign reading=ma
  < sign reading=ma
"""
results = A.search(query)

  1.66s 1384 results

Bare export¶

You can export the table of results to Excel.

The following command writes a tab-separated file results.tsv to your downloads directory.

You can specify arguments toDir=directory and toFile=file name to write to a different file. If the directory does not exist, it will be created.

We stick to the default, however.

In [6]:

A.export(results)

Check out the contents:

In [7]:

checkout()

R	S1	S2	S3	NODE1	TYPE1	TEXT1	ln1	NODE2	TYPE2	TEXT2	reading2	NODE3	TYPE3	TEXT3	reading3	NODE4	TYPE4	TEXT4	reading4
1	P361248	obverse	2	865395	line	um-ma _dam-gar3_-ru-tum-ma	2	1001	sign	um-	um	1002	sign	ma 	ma	1007	sign	ma	ma
2	P360984	obverse	2	865641	line	um-ma wa-la2-wa-la2-ma	2	2636	sign	um-	um	2637	sign	ma 	ma	2642	sign	ma	ma
3	P360987	obverse	2	865746	line	[um]-ma i-ku-pi2-a-ma	2	3179	sign	[um]-	um	3180	sign	ma 	ma	3185	sign	ma	ma
4	P361576	obverse	2	866190	line	um-ma szu-su2-en6-ma	2	6070	sign	um-	um	6071	sign	ma 	ma	6075	sign	ma	ma
5	P360469	obverse	1	866440	line	um-ma ku-lu-ma-a-ma	1	7587	sign	um-	um	7588	sign	ma 	ma	7591	sign	ma-	ma
6	P360469	obverse	1	866440	line	um-ma ku-lu-ma-a-ma	1	7587	sign	um-	um	7588	sign	ma 	ma	7593	sign	ma	ma
7	P360470	obverse	3	866464	line	um-ma a-szur3-mu-ta-bi4-il5-ma	3	7763	sign	um-	um	7764	sign	ma 	ma	7771	sign	ma	ma
8	P360471	obverse	1	866500	line	um-ma e-la-ma-ma#	1	8062	sign	um-	um	8063	sign	ma 	ma	8066	sign	ma-	ma
9	P360471	obverse	1	866500	line	um-ma e-la-ma-ma#	1	8062	sign	um-	um	8063	sign	ma 	ma	8067	sign	ma#	ma

You see the following columns:

R the sequence number of the result tuple in the result list
S1 S2 S3 the section as P-number, face, line number, in separate columns
NODEi TYPEi the node and its type, for each node i in the result tuple
TEXTi the full text of node i, if the node type admits a concise text representation
reading2-4 the value of feature reading, since our query mentions the feature reading on nodes 2-4

Poorer exports¶

If you do not need the full text of the lines, you can leave them out by specifying a smaller condense type.

The export function provides text for all nodes whose type is not too big. What is too big is determined by the condense type.

In this corpus, the default condense type is line. Node types bigger than lines will not get text.

Now, if we change the condense type to something smaller than line, e.g. word, the line text will be suppressed.

In [8]:

A.export(results, condenseType="word")
checkout()

R	S1	S2	S3	NODE1	TYPE1	ln1	NODE2	TYPE2	TEXT2	reading2	NODE3	TYPE3	TEXT3	reading3	NODE4	TYPE4	TEXT4	reading4
1	P361248	obverse	2	865395	line	2	1001	sign	um-	um	1002	sign	ma 	ma	1007	sign	ma	ma
2	P360984	obverse	2	865641	line	2	2636	sign	um-	um	2637	sign	ma 	ma	2642	sign	ma	ma
3	P360987	obverse	2	865746	line	2	3179	sign	[um]-	um	3180	sign	ma 	ma	3185	sign	ma	ma
4	P361576	obverse	2	866190	line	2	6070	sign	um-	um	6071	sign	ma 	ma	6075	sign	ma	ma
5	P360469	obverse	1	866440	line	1	7587	sign	um-	um	7588	sign	ma 	ma	7591	sign	ma-	ma
6	P360469	obverse	1	866440	line	1	7587	sign	um-	um	7588	sign	ma 	ma	7593	sign	ma	ma
7	P360470	obverse	3	866464	line	3	7763	sign	um-	um	7764	sign	ma 	ma	7771	sign	ma	ma
8	P360471	obverse	1	866500	line	1	8062	sign	um-	um	8063	sign	ma 	ma	8066	sign	ma-	ma
9	P360471	obverse	1	866500	line	1	8062	sign	um-	um	8063	sign	ma 	ma	8067	sign	ma#	ma

Richer exports¶

If we want to see the text in another format, we can specify it:

In [9]:

A.export(results, fmt="text-orig-unicode")
checkout()

R	S1	S2	S3	NODE1	TYPE1	TEXT1	ln1	NODE2	TYPE2	TEXT2	reading2	NODE3	TYPE3	TEXT3	reading3	NODE4	TYPE4	TEXT4	reading4
1	P361248	obverse	2	865395	line	𒌝𒈠 𒁮𒃼𒊒𒌈𒈠	2	1001	sign	𒌝	um	1002	sign	𒈠 	ma	1007	sign	𒈠	ma
2	P360984	obverse	2	865641	line	𒌝𒈠 𒁀𒇲𒁀𒇲𒈠	2	2636	sign	𒌝	um	2637	sign	𒈠 	ma	2642	sign	𒈠	ma
3	P360987	obverse	2	865746	line	𒌝𒈠 𒄿𒆪𒁉𒀀𒈠	2	3179	sign	𒌝	um	3180	sign	𒈠 	ma	3185	sign	𒈠	ma
4	P361576	obverse	2	866190	line	𒌝𒈠 𒋗𒍪𒅔𒈠	2	6070	sign	𒌝	um	6071	sign	𒈠 	ma	6075	sign	𒈠	ma
5	P360469	obverse	1	866440	line	𒌝𒈠 𒆪𒇻𒈠𒀀𒈠	1	7587	sign	𒌝	um	7588	sign	𒈠 	ma	7591	sign	𒈠	ma
6	P360469	obverse	1	866440	line	𒌝𒈠 𒆪𒇻𒈠𒀀𒈠	1	7587	sign	𒌝	um	7588	sign	𒈠 	ma	7593	sign	𒈠	ma
7	P360470	obverse	3	866464	line	𒌝𒈠 𒀀𒋓𒈬𒋫𒁁𒂖𒈠	3	7763	sign	𒌝	um	7764	sign	𒈠 	ma	7771	sign	𒈠	ma
8	P360471	obverse	1	866500	line	𒌝𒈠 𒂊𒆷𒈠𒈠	1	8062	sign	𒌝	um	8063	sign	𒈠 	ma	8066	sign	𒈠	ma
9	P360471	obverse	1	866500	line	𒌝𒈠 𒂊𒆷𒈠𒈠	1	8062	sign	𒌝	um	8063	sign	𒈠 	ma	8067	sign	𒈠	ma

Additional features¶

If we want to export additional features, we just have to mention them. In order to do so and not change the result set, put a * behind the feature.

The * means: always true, no matter what's in the feature, even if there is nothing in there.

Lets ask for the flags on the first ma.

In [10]:

query = """
line ln<4
  =: sign reading=um
  <: sign reading=ma flags*
  < sign reading=ma
"""
results = A.search(query)

  2.08s 1384 results

The same number of results.

We do the export again and peek at the results.

In [11]:

A.export(results, condenseType="word")
checkout()

R	S1	S2	S3	NODE1	TYPE1	ln1	NODE2	TYPE2	TEXT2	reading2	NODE3	TYPE3	TEXT3	flags3	reading3	NODE4	TYPE4	TEXT4	reading4
1	P361248	obverse	2	865395	line	2	1001	sign	um-	um	1002	sign	ma 		ma	1007	sign	ma	ma
2	P360984	obverse	2	865641	line	2	2636	sign	um-	um	2637	sign	ma 		ma	2642	sign	ma	ma
3	P360987	obverse	2	865746	line	2	3179	sign	[um]-	um	3180	sign	ma 		ma	3185	sign	ma	ma
4	P361576	obverse	2	866190	line	2	6070	sign	um-	um	6071	sign	ma 		ma	6075	sign	ma	ma
5	P360469	obverse	1	866440	line	1	7587	sign	um-	um	7588	sign	ma 		ma	7591	sign	ma-	ma
6	P360469	obverse	1	866440	line	1	7587	sign	um-	um	7588	sign	ma 		ma	7593	sign	ma	ma
7	P360470	obverse	3	866464	line	3	7763	sign	um-	um	7764	sign	ma 		ma	7771	sign	ma	ma
8	P360471	obverse	1	866500	line	1	8062	sign	um-	um	8063	sign	ma 		ma	8066	sign	ma-	ma
9	P360471	obverse	1	866500	line	1	8062	sign	um-	um	8063	sign	ma 		ma	8067	sign	ma#	ma

As you see, you have an extra column flags3.

This gives you a lot of control over the generation of spreadsheets.

Not from queries¶

You can also export lists of node tuples that are not obtained by a query:

In [12]:

words = F.otype.s("word")[1000:1010]
signs1 = F.otype.s("sign")[100000:100010]
signs2 = F.otype.s("sign")[200000:200010]
tuples = list(zip(words, signs1, signs2))

tuples

Out[12]:

[(976132, 100001, 200001),
 (976133, 100002, 200002),
 (976134, 100003, 200003),
 (976135, 100004, 200004),
 (976136, 100005, 200005),
 (976137, 100006, 200006),
 (976138, 100007, 200007),
 (976139, 100008, 200008),
 (976140, 100009, 200009),
 (976141, 100010, 200010)]

Ten rows, each row has a word node and two sign nodes.

The word and the signs in each row do not have any meaningful relationship!

Let's do a bare export:

In [13]:

A.export(tuples)
checkout()

R	S1	S2	S3	NODE1	TYPE1	TEXT1	ln1	NODE2	TYPE2	TEXT2	reading2	NODE3	TYPE3	TEXT3	flags3	reading3
1	P360982	reverse	3	976132	word	szu-pi3-a-ni-ka3 		100001	sign	num	num	200001	sign	[a?]-	?	a
2	P360982	reverse	3	976133	word	lu		100002	sign	1(u) 	u	200002	sign	ta 		ta
3	P360982	reverse	4	976134	word	u2-sze2-szu-bu-szu-nu		100003	sign	5(disz) 	disz	200003	sign	i-		i
4	P360982	reverse	5	976135	word	_igi_ 		100004	sign	_gin2 	gin2	200004	sign	na 		na
5	P360982	reverse	5	976136	word	a-na-na		100005	sign	ku3-	ku3	200005	sign	bu 		bu
6	P360982	reverse	6	976137	word	_igi_ 		100006	sign	babbar_	babbar	200006	sign	x 		x
7	P360982	reverse	6	976138	word	ha-ma-na-ni		100007	sign	sza 	sza	200007	sign	[...]		
8	P360982	reverse	7	976139	word	_igi_ 		100008	sign	ta-	ta	200008	sign	a-		a
9	P360982	reverse	7	976140	word	ut-ni-ih-szu		100009	sign	ad-	ad	200009	sign	na-		na

Wait a minute: why are the reading2 and reading3 and flags3 columns showing up?

It is because we have run a query before where we asked for these features.

If we do not want to be influenced by previous things we've run, we need to reset the display:

In [14]:

A.displayReset("tupleFeatures")

Again:

In [15]:

A.export(tuples)
checkout()

R	S1	S2	S3	NODE1	TYPE1	TEXT1	NODE2	TYPE2	TEXT2	NODE3	TYPE3	TEXT3
1	P360982	reverse	3	976132	word	szu-pi3-a-ni-ka3 	100001	sign	num	200001	sign	[a?]-
2	P360982	reverse	3	976133	word	lu	100002	sign	1(u) 	200002	sign	ta 
3	P360982	reverse	4	976134	word	u2-sze2-szu-bu-szu-nu	100003	sign	5(disz) 	200003	sign	i-
4	P360982	reverse	5	976135	word	_igi_ 	100004	sign	_gin2 	200004	sign	na 
5	P360982	reverse	5	976136	word	a-na-na	100005	sign	ku3-	200005	sign	bu 
6	P360982	reverse	6	976137	word	_igi_ 	100006	sign	babbar_	200006	sign	x 
7	P360982	reverse	6	976138	word	ha-ma-na-ni	100007	sign	sza 	200007	sign	[...]
8	P360982	reverse	7	976139	word	_igi_ 	100008	sign	ta-	200008	sign	a-
9	P360982	reverse	7	976140	word	ut-ni-ih-szu	100009	sign	ad-	200009	sign	na-

Display setup¶

When we exported query results, we could mention features in the query with a * so that they got exported. If we do not have a previous query we can achieve the same effect by specifying the desired export features per column.

The display option tupleFeatures takes care of that.

In [16]:

A.displaySetup(
    tupleFeatures=(
        (0, "atfpre atf atfpost"),
        (1, "symr symu"),
        (2, "symr symu"),
    )
)

We assign extra features per member of the tuple.

In the above case:

the first (0) member (the word node), gets features atfpre (preceding bracketing characters), atf, atfpost (subsequent clustering characters);
the second and third member (the sign nodes), get features symr (subscript latin text) and symu (cuneiform unicode).

In [17]:

A.export(tuples)
checkout()

R	S1	S2	S3	NODE1	TYPE1	TEXT1	atfpre1	atf1	atfpost1	NODE2	TYPE2	TEXT2	symr2	symu2	NODE3	TYPE3	TEXT3	symr3	symu3
1	P360982	reverse	3	976132	word	szu-pi3-a-ni-ka3 		szu-pi3-a-ni-ka3		100001	sign	num	num	𒉏	200001	sign	[a?]-	a	𒀀
2	P360982	reverse	3	976133	word	lu		lu		100002	sign	1(u) 	1(u)	𒌋	200002	sign	ta 	ta	𒋫
3	P360982	reverse	4	976134	word	u2-sze2-szu-bu-szu-nu		u2-sze2-szu-bu-szu-nu		100003	sign	5(disz) 	5(diš)	𒐊	200003	sign	i-	i	𒄿
4	P360982	reverse	5	976135	word	_igi_ 		_igi_		100004	sign	_gin2 	gin₂	𒂅	200004	sign	na 	na	𒈾
5	P360982	reverse	5	976136	word	a-na-na		a-na-na		100005	sign	ku3-	ku₃	𒆬	200005	sign	bu 	bu	𒁍
6	P360982	reverse	6	976137	word	_igi_ 		_igi_		100006	sign	babbar_	babbar	𒌓	200006	sign	x 	x	x
7	P360982	reverse	6	976138	word	ha-ma-na-ni		ha-ma-na-ni		100007	sign	sza 	ša	𒊭	200007	sign	[...]	…	…
8	P360982	reverse	7	976139	word	_igi_ 		_igi_		100008	sign	ta-	ta	𒋫	200008	sign	a-	a	𒀀
9	P360982	reverse	7	976140	word	ut-ni-ih-szu		ut-ni-ih-szu		100009	sign	ad-	ad	𒀜	200009	sign	na-	na	𒈾

Chained queries¶

You can chain queries like this:

In [18]:

results = (
    A.search(
        """
line
  cluster type=missing
    sign reading=disz repeat>4
"""
    )
    + A.search(
        """
line
  cluster type=langalt
    sign reading=um
"""
    )
)

  0.60s 99 results
  0.62s 1 result

In such cases, it is better to setup the features yourself:

In [19]:

A.displaySetup(
    tupleFeatures=(
        (0, "lnno"),
        (1, "type"),
        (2, "langalt missing"),
    ),
    fmt="text-orig-rich",
)

Now we can do a fine export:

In [20]:

A.export(results)
checkout()

R	S1	S2	S3	NODE1	TYPE1	TEXT1	lnno1	NODE2	TYPE2	TEXT2	type2	NODE3	TYPE3	TEXT3	langalt3	missing3
1	P361431	envelope - reverse	9	865864	line	3(aš) gu₂ 5(u) 5(diš) ma-na uruda sag₁₀	9	766932	cluster	3(aš) gu₂ 5(u) 5(diš) ma-na 	missing	3875	sign	5(diš) 		1
2	P360467	envelope - obverse	5	866400	line	8(diš) ma-na ku₃-babbar ṣa-ru-pa₂-am	5	767260	cluster	8(diš) ma-	missing	7424	sign	8(diš) 		1
3	P360499	envelope	14	867010	line	1(diš) ma-na 1(u) 5(diš) gin₂	14	767648	cluster	1(u) 5(diš) 	missing	11267	sign	5(diš) 		1
4	P360526	obverse	5	867983	line	1/2(diš) ma-na 7(diš) 1/2(diš) gin₂	5	768250	cluster	7(diš) 	missing	16045	sign	7(diš) 		1
5	P360604	obverse	1	869813	line	5(diš) qa₂-qa₂-ra-tim	1	769396	cluster	5(diš) 	missing	28635	sign	5(diš) 		1
6	P360670	reverse	11	871247	line	6(diš) ku-ta-nu 1/2(diš) ma-na-ta 3(diš) ma-na	11	770396	cluster	6(diš) ku-	missing	38736	sign	6(diš) 		1
7	P360674	obverse	8	871396	line	6(diš) anše 7(diš) ma-na an-na	8	770505	cluster	7(diš) 	missing	40286	sign	7(diš) 		1
8	P360705	reverse	3	872530	line	8(diš) 1/3(diš) ma-na an-na a-na šu-ma-a	3	771172	cluster	8(diš) 1/3(diš) 	missing	50915	sign	8(diš) 		1
9	P361357	obverse	46	875282	line	7(diš) da-a-a-num ša di₂-na-am i-na	46	773068	cluster	7(diš) da-	missing	71923	sign	7(diš) 		1

All chapters:

start become an expert in creating pretty displays of your text structures
display become an expert in creating pretty displays of your text structures
search turbo charge your hand-coding with search templates
export Excel make tailor-made spreadsheets out of your results
share draw in other people's data and let them use yours
similarLines spot the similarities between lines

See the cookbook for recipes for small, concrete tasks.

CC-BY Dirk Roorda