textTinyR (Q31261)

From MaRDI portal

Jump to:navigation, search

Text Processing for Small or Big Data Files

Language	Label	Description	Also known as
English	textTinyR	Text Processing for Small or Big Data Files

Statements

0 references

software version identifier

1.1.7

publication date

26 October 2021

0 references

1.0.0

publication date

7 January 2017

0 references

1.0.1

publication date

11 January 2017

0 references

1.0.2

publication date

20 January 2017

0 references

1.0.3

publication date

29 January 2017

0 references

1.0.4

publication date

28 March 2017

0 references

1.0.5

publication date

1 April 2017

0 references

1.0.6

publication date

3 May 2017

0 references

1.0.7

publication date

5 June 2017

0 references

1.0.8

publication date

31 October 2017

0 references

1.0.9

publication date

16 January 2018

0 references

1.1.0

publication date

3 April 2018

0 references

1.1.1

publication date

17 May 2018

0 references

1.1.2

publication date

25 July 2018

0 references

1.1.3

publication date

14 April 2019

0 references

1.1.4

publication date

5 May 2021

0 references

1.1.5

publication date

13 October 2021

0 references

1.1.6

publication date

21 October 2021

0 references

1.1.8

publication date

4 December 2023

0 references

Lampros Mouselimis

0 references

0 references

4 December 2023

0 references

It offers functions for splitting, parsing, tokenizing and creating a vocabulary for big text data files. Moreover, it includes functions for building a document-term matrix and extracting information from those (term-associations, most frequent terms). It also embodies functions for calculating token statistics (collocations, look-up tables, string dissimilarities) and functions to work with sparse matrices. Lastly, it includes functions for Word Vector Representations (i.e. 'GloVe', 'fasttext') and incorporates functions for the calculation of (pairwise) text document dissimilarities. The source code is based on 'C++11' and exported in R through the 'Rcpp', 'RcppArmadillo' and 'BH' packages.

0 references

Lampros Mouselimis

0 references

copyright license

GNU General Public License, version 3.0

0 references

depends on software

0 references

software version identifier

≥ 3.2.3

0 references

software version identifier

≥ 0.12.10

0 references

0 references

0 references

0 references

MaRDI profile type

MaRDI software profile

0 references

source code repository

https://github.com/cran/textTinyR

0 references

Identifiers

0 references

0 references

Software Heritage ID

swh:1:snp:fd64cc5540540a0d592f061cb534cbc18a6a7e8d

source code repository

https://github.com/cran/textTinyR

20 December 2023

0 references

Sitelinks

Mathematics(1 entry)

mardi Software:31261

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q31261&oldid=33133404"