Sign In:     


Forum: Greek Forum

Topic: Πρόβλημα στην εύρεση με ελληνικούς χαρακτήρες

This topic is old and might contain outdated or incorrect information.

Γενικότερα ψάχνω με λατινικούς χαρακτήρες ακόμα και για ελληνικές αναζητήσεις (η βάση με τα ελληνικά μου τραγούδια αποτελείται από ελληνικούς χαρακτήρες). Χθες προσπάθησα να εμφανίσω όλα τα τραγούδια του Αντώνη Ρέμου. Με πληκτρολόγιο στα ελληνικά προσπάθησα: αντω και ρεμ, χωρίς να πάρω αποτελέσματα... Αντιθέτως με αναζήτηση remos εμφανίζει κανονικά. Πιθανών λόγω τονισμού στα ελληνικά πρέπει να χρησιμοποιείται ο τόνος απαραιτήτως... Είναι φυσιολογική αυτή η συμπεριφορά; Μήπως θα ήταν καλύτερο να αγνοείται ο τονισμός;
 

Posted Sun 22 Feb 15 @ 7:14 pm
ο τονισμός βοηθάει να βρεις ακριβώς το τραγούδι που ψάχνεις και να μην σου βγάζει άσχετα τραγούδια όπως το κάνει όταν ψάχνεις με το πληκτρολόγιο στα αγγλικά.Σε βοηθάει ο τονισμός πολύ όταν ο σκληρός σου έχει χιλιάδες τραγούδια.Μακάρι και εγω να τα είχα μετατρέψει όλα σε ελληνικά μικρά με τόνους.
 

Δεν βρίσκω λόγω να μην αγνοείται ο τονισμός στην εύρεση. Θα έπρεπε να βγάζει τα ίδια αποτελέσματα για την αναζήτηση του: αντω και αντώ πράγμα που δεν συμβαίνει τώρα...
 

Δυστυχώς ή ευτυχώς όταν κάνεις αναζήτηση στα Ελληνικά ο τόνος ΕΙΝΑΙ απαραίτητος και όχι για να βοηθήσει στην πιο ακριβή εύρεση, αλλά γιατί στο τεχνικό κομμάτι το τονούμενο γράμμα με το μη τονούμενο είναι διαφορετικοί χαρακτήρες UTF. Έτσι λοιπόν δεν είναι αυτή την στιγμή εφικτό να "συγχωνεύσεις" τους διαφορετικούς χαρακτήρες σαν ένα.
Η συμβουλή μου είναι να κάνεις αναζήτηση με το πληκτρολόγιο στα Αγγλικά. Έτσι θα παίρνεις πάντα τα σωστά αποτελέσματα.
Πχ: antvnhw remos ή antvn rem ή remos
Παρατήρησε οτι δεν έγραψα Greeklish. Αντίθετα πληκτρολόγησα το ελληνικό όνομα με το πληκτρολόγιο γυρισμένο στα Αγγλικά.

Σημείωση: Αυτό το hack (να βγαίνουν τα Ελληνικά αποτελέσματα με το πληκτολόγιο στα Αγγλικά) το κάναμε για να μην χρειάζεται να αλλάζεις γλώσσα συνέχεια ώστα να σου δουλεύουν και τα keyboard shortcuts και είναι "μετάφραση" των ANSI χαρακτήρων σε Greek-UTF. Δεν είναι αντικατάσταση - συγχώνευση UTF χαρακτήρων.
Σε αυτό το hack υπάρχει ένα bug αυτή την στιγμή που 2-3 μεταφράσεις χαρακτήρων δεν γίνονται σωστά και περιμένουμε να διορθωθεί.
Έτσι για παράδειγμα (μιας και έπεσες στην περίπτωση) το v στα Αγγλικά ψάχνει για ω ή Ω αλλά όχι για ώ και Ώ
Δεν ισχύει όμως το ίδιο γενικά για τους τόνους όμως (πχ το e ψάνχει κανονικά για ε, Ε, έ, Έ
 

Ευχαριστώ Γιώργο για τις συμβουλές σου αλλά γνωρίζω ότι δεν είναι δύσκολο να ενσωματωθεί στον κώδικα η εξίσωση α=ά, ε=έ κτλ.
Νομίζω ότι θα διευκόλυνε πολύ όσους αναζητάνε κομμάτια και πρέπει να γλυτώσουν χρόνο...
 

Αν θες να μιλήσουμε ανοιχτά, δύσκολο δεν είναι. Αλλά θα πρέπει να πείσεις τους προγραμματιστές να το κάνουν. Κι αν το κάνουν για τα Ελληνικά, τότε γιατί όχι για τα Γαλλικά κτλ...
Και επίσης σου εξήγησα οτι αυτή την στιγμή τεχνικά δεν κάνουμε παρεμβάσεις (εξισώσεις/αντικαταστάσεις) μέσα στο σύνολο των UTF χαρακτήρων. Το μόνο που κάνουμε είναι να μεταφράζουμε από ANSI στο Ελληνικό UTF υποσύνολο. Και σε αυτή την εξίσωση μετάφρασης (που κανονικά θα ήταν 1 προς 1) έχουμε συμπεριλάβει το e=ε=έ=Ε=Έ

Πάντως αν κάποια στιγμή μπορέσουμε να το "σπρώξουμε" στο dev team θα το υλοποιήσουμε.
 

Χαίρομαι που καταλαβαινόμαστε :)
Προς το παρόν θα χρησιμοποιώ τους λατινικούς χαρακτήρες όπως μου δίδαξες.
Θα επανέλθω αν αντιμετωπίσω πάλι κάποιο πρόβλημα...
 



(Old topics and forums are automatically closed)