]> git.llucax.com Git - software/subdivxget.git/log
software/subdivxget.git
12 years agoAdd fairly fine grained filtering support
Leandro Lucarella [Sat, 14 Jul 2012 18:08:31 +0000 (20:08 +0200)]
Add fairly fine grained filtering support

Now the program can make only one query but it can accept multiple
optional filters based on the fields. Each extra argument is a filter
specification, and filters are all joined using a logical AND.

The individual filters have the format X:fitler, there X is a field
specification:
t = titulo
d = desc
a = autor
f = formato
c = comentarios
C = cds
F = fecha
D = downloads

And filter is a string that should be found on that field (case
insensitive). If the format specifier is not known (or there isn't one)
the filter string is looked in all the fields.

12 years agoImprove field boundary detection
Leandro Lucarella [Sat, 14 Jul 2012 18:08:30 +0000 (20:08 +0200)]
Improve field boundary detection

If some fields have tags inside of them, they are cut. This patch keep
track of the depth for all relevant fields to avoid truncation.

12 years agoIgnore br tags for tag depth calculations
Leandro Lucarella [Sat, 14 Jul 2012 18:09:51 +0000 (20:09 +0200)]
Ignore br tags for tag depth calculations

SubDivX uses old, unclosed br tags, so they break the tag depth
calculation.

12 years agoRename subtitle field title -> titulo
Leandro Lucarella [Sat, 14 Jul 2012 18:09:50 +0000 (20:09 +0200)]
Rename subtitle field title -> titulo

All other fields are in Spanish (matching subdivx fields when possible
and reasonable), so we change title to Spanish too for consistency.

12 years agoInitialize SubDivXQuery.cur
Leandro Lucarella [Sat, 14 Jul 2012 18:09:49 +0000 (20:09 +0200)]
Initialize SubDivXQuery.cur

This is not really needed, but serves as documentation on the class
members.

12 years agoIgnore script and style tags
Leandro Lucarella [Sat, 14 Jul 2012 18:09:48 +0000 (20:09 +0200)]
Ignore script and style tags

Those tags can have HTML comments inside of them, and they are not
parsed by HTMLParser, so we just ignore them to avoid issues, we don't
really need them for anything anyway.

12 years agoReduce indentation by returning ASAP
Leandro Lucarella [Sat, 14 Jul 2012 18:09:47 +0000 (20:09 +0200)]
Reduce indentation by returning ASAP

12 years agoGet all available pages
Leandro Lucarella [Sat, 14 Jul 2012 18:09:46 +0000 (20:09 +0200)]
Get all available pages

SubDivX pages the results, so we keep downloading the next page to get
all the available results until we can't find any subtitles in a page.

12 years agoRemove unused class Subtitle
Leandro Lucarella [Sat, 14 Jul 2012 18:09:44 +0000 (20:09 +0200)]
Remove unused class Subtitle

12 years agoInitial commit
Leandro Lucarella [Sat, 14 Jul 2012 18:12:51 +0000 (20:12 +0200)]
Initial commit