<td>([^<]*)</td> - субрегулярка regexp -all -inline {[[:<:]][0-9]+[[:>:]]} $a - найти все числа в $a [A-Za-z] [[:alpha:]] - буквы (2 еще и нелатиницу цепляет) [0-9] [[:digit:]] \d - цифры [ \b\f\n\r\t\v] [[:space:]] \s - пробелы, табуляции, переводы строк [[:digit:][:alpha:]_] [\d[:alpha:]_] [[:alnum:]_] \w - все буквы, цифры и _ [[:<:]] and [[:>:]] - начало и конец слова .+\n - помечается максимальный блок до последнего перевода строки .+?\n - помечается символы до первого перевода строки </p> <td>(.*?)</td> - пометить блок между тегами
опции regsub и regexp:
lineanchor - заставляет рассматривать ^$ как признаки начала и конца строки а не последовательности
linestop - исключает символ переноса из набора .*