Разделение списка

При помощи этой опрации Вы можете разделить исходный файл на несколько. Обратите внимание, что в процессе разделения плохие адреса не будут записаны в выходные файлы и, возможно, предварительно стоит выполнить операцию исправления адресов. Обратите внимание, что выходные файлы всегда именуются отлично от исходного файла, и исходный файл не может быть поврежден или перезаписан при выполнении операции. Поддерживаются следующие режимы разделения:

По размеру.

При этом Вы можете задать максимальный размер выходных файлов. Если, например, исходный файл 110 Кб, и указан размер выходного файла в 50 Кб, то на выходе получится три файла — первые два по 50 Кб и один размером 10 Кб. Адреса переписываются в выходные файлы в том порядке, в каком они идут в исходном файле.

По числу адресов

Если указано, что выходной файл должен содержать не более 1000 адресов, а в исходном списке 3500 адресов, то на выходе будет четыре файла — в первых трех по 1000, и в последнем 500 адресов. Адреса переписываются в выходные файлы в том порядке, в каком они идут в исходном файле.

При изменении домена первого уровня

Перед обработкой файла, очевидно, нужно выполнить операцию сортировки адресов в списке по домену первого уровня. Пусть у Вас есть гигантский список, и Вы хотите сохранить из него в отдельные файлы все адреса с доменов .COM, .NET и .ORG. Тогда, вначале Вам нужно отсортировать исходный список, потом сделать операцию разделения по домену первого уровня (при этом на каждый домен первого уровня будет создан отдельный файл с адресами, их может быть около сотни — .IT, .JP, .ES и т.п.), и затем исключить из исходного файла содержимое тех файлов, что содержат адреса .COM, .NET и .ORG (в зависимости от выбраной схемы именования, они могут называться, например, mylist.txt.COM, mylist.txt.NET, mylist.txt.ORG). После чего стереть все файлы, кроме исходого и mylist.txt.COM, mylist.txt.NET, mylist.txt.ORG. Итого, требуемая задача может быть выполнена при помощи трех операций MLW.

При изменении домена второго уровня

Аналогично предыдущему пункту. Однако следует учесть, что и изменение домена первого уровня учитывается. Например, адреса с доменов mysite.com и mysite.org будут записаны в разные выходные файлы.

При изменении имени ящика

Аналогично, исходный список должен быть вначале отсортирован по имени почтового ящика. При этом изменения в домене не учитываются, адреса webmaster@microsoft.com и webmaster@mailutilities.com попадут в один выходной файл.

Также программе нужно задать механизм именования выходных файлов. Возможны следующие варианты:

Добавлять порядковый номер

Каждому выходному файлу будет присваиваться последовательный номер, начиная с единицы. Например, исходный список называется mylist.txt и программа генерирует три выходных файла, тогда они будут называться mylist.txt.001, mylist.txt.002 и mylist.txt.003.

По домену первого уровня первого адреса

Например, мы делим по изменению домена первого уровня следующий файл:

jsmith@email.com

jane@email.com

andrian@email.net

andrian@email.org

Тогда будут сформированы три выходных файла: mylist.txt.com, mylist.txt.net и mylist.txt.org. Теперь предположим, что мы пытаемся поделить не отсортированный файл по домену первого уровня:

jsmith@email.com

andrian@email.net

jane@email.com

andrian@email.org

MLW сформирует файлы mylist.txt.com и mylist.txt.net. После чего программа дойдет до адреса jane@email.com, при этом домен первого уровня поменяется (с .net на .com) и программа начнет новый файл, поименует его согласно настройке как mylist.txt.com. При этом первый сформированный файл с этим именем будет перезаписан без предупреждения.

По домену второго уровня первого адреса

Аналогично предыдущему пункту. Теоретически, этот режим именования должен использоваться только при разделении файла по домену второго уровня. Однако MLW позволяет использовать его при любом варианте разделения файла. Именно по этому в названии этого режима присутствует приписка "...первого адреса", так как адреса сохраняемые в файл могут быть с абсолютно разных доменов, не смотря на выбранную схему именования выходных файлов.

По имени почтового ящика первого адреса

Полностью аналогично двум предыдущим схемам именования выходных файлов.